План на курса

Въведение в Speech Recognition и синтез

  • Основи на речевите технологии
  • Основи на системите за разпознаване на реч
  • Преглед на синтеза на речта

Роля на LLM в говорните технологии

  • Разбиране на LLM в разпознаването на реч
  • LLM в синтеза на реч
  • Предимства на LLM пред традиционните модели

Данни за Speech Recognition и Синтез

  • Събиране и обработка на данни за речеви технологии
  • Набори от данни за обучение за LLM
  • Етични съображения при обработката на данни

Обучение на LLM за речеви приложения

  • Техники за дълбоко обучение при разпознаване на реч
  • Архитектури на невронни мрежи за синтез на реч
  • Фина настройка на LLM за конкретни речеви задачи

Внедряване на LLMs в речеви системи

  • Интегриране на LLM с машини за разпознаване на реч
  • Разработване на естествено звучащи речеви синтезатори
  • Дизайн на потребителски интерфейс за речеви приложения

Тестване и оценка на речеви системи

  • Методи за проверка на точността на разпознаване на реч
  • Оценяване на естествеността на синтезираната реч
  • Потребителски проучвания и събиране на обратна връзка

Предизвикателства и решения в говорните технологии

  • Разглеждане на често срещани проблеми при разпознаването на реч
  • Преодоляване на пречките при синтеза на речта
  • Казуси: успешно внедряване на LLMs

Бъдещи насоки в говорните технологии

  • Нововъзникващи тенденции в разпознаването и синтеза на реч
  • Ролята на LLM в многоезичните речеви системи
  • Иновации и изследователски възможности

Проект и оценка

  • Проектиране и внедряване на система за разпознаване или синтез на реч с помощта на LLM
  • Партньорски прегледи и групови дискусии
  • Крайна оценка и обратна връзка

Обобщение и следващи стъпки

Изисквания

  • Разбиране на основните концепции за програмиране
  • Опитът с Python програмиране се препоръчва, но не е задължителен
  • Познаването на основните концепции за машинно обучение и невронни мрежи е от полза

Публика

  • Разработчици на софтуер
  • Учени по данни
  • Продуктови мениджъри
 14 Hours

Брой участници



Цена за участник

Свързани Kурсове

LangChain: Building AI-Powered Applications

14 Hours

LangChain Fundamentals

14 Hours

Introduction to Google Gemini AI

14 Hours

Google Gemini AI for Content Creation

14 Hours

Google Gemini AI for Transformative Customer Service

14 Hours

Google Gemini AI for Data Analysis

21 Hours

Generative AI with Large Language Models (LLMs)

21 Hours

LlamaIndex: Enhancing Contextual AI

14 Hours

LlamaIndex: Developing LLM Powered Applications

42 Hours

Introduction to Large Language Models (LLMs)

14 Hours

LLMs for Automated Customer Support

14 Hours

LLMs for Business Intelligence

14 Hours

LLMs for Content Generation

14 Hours

LLMs for Code Generation and Documentation

14 Hours

Advanced LLMs for NLP Tasks

21 Hours

Свързани Kатегории

1