План на курса

Увод в мултимодалността на Gemini 3

  • Възможности по отношение на текст, изображения, аудио и видео
  • Избор на модели и обзор на ендпоинтовете
  • Основни концепции в областта на мултимодалното причиняване на съзретия

Работа с текст и структурирани входи

  • Стратегии за подканване на генерирането на текст
  • Метаданни, контекстни прозорци и ембедингове
  • Оркестрировка с базирана на текст мултимодална задача

Разбиране на изображения и визуални работни процеси

  • Анализ и интерпретация на изображения с Gemini 3
  • Създаване на инструменти за визуално търсене и маркиране
  • Построение на взаимодействия между изображенията и текста

Обработка на аудио входи

  • Работа с разпознаване на реч и транскрипция
  • Детекция и интерпретация на аудио събития
  • Интегриране на аудио входи с текст и визуални данни

Видео интелигенция и анализ на сцени

  • Разбиране на видео кадър по кадър и непрекъснато разбиране
  • Създаване на инструменти за синтезиране и извличане на важни моменти
  • Автоматизация на видео и работни процеси с базирани на видео съдържание

Проектиране на архитектури за мултимодални приложения

  • Комбиниране на различни входни типове в един поток
  • Забавки, разходи и изчислителни параметри
  • Лучши практики за масштабиращи се мултимодални системи

Построение на прототипи за мултимодални приложения

  • Работа по създаване на прототипи с мултимодални входи
  • Бърза итерация с подканване
  • Тестване и усъвършенстване на потоци за потребителски опит

Разпространение на мултимодални решения

  • Стратегии за разпространение и настройка на среда
  • Мониторинг на реална производителност
  • Разглеждане на сигурността и съответствието с нормативите

Резюме и следващи стъпки

Изисквания

  • Разбиране на модерните концепции в областта на изкуствения интелект
  • Опит с Python или JavaScript
  • Познаване на REST API

Целева аудитория

  • Дизайнери
  • Създатели на съдържание
  • Технически екипи за продукти
 14 Часове

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории