План на курса

Основни на аудио класификация

  • Типове звукови събития: екологични, механични, генерирани от хора
  • Обзор на случаи за употреба: наблюдение, мониторинг, автоматизация
  • Аудио класификация срещу детекция срещу сегментация

Аудио данни и извличане на характеристики

  • Типове аудио файлове и формати
  • Честота на извличане, прозорчеви процеси, размер на рамките
  • Извличане на MFCCs, хрома характеристики, mel-спектрограми

Подготовка и аннотиране на данни

  • UrbanSound8K, ESC-50 и персонализирани набори данни
  • Етикетиране на звукови събития и временни граници
  • Балансиране на набори данни и увеличаване на аудио

Създаване на модели за аудио класификация

  • Използване на конволюционни нейронни мрежи (CNNs) за аудио
  • Вход на модела: сурова вълнова форма срещу характеристики
  • Функции за загуба, метрики за оценка и преобръщане

Детекция на събития и временна локализация

  • Стратегии за детекция базирана на рамки и сегменти
  • Постобработка на детекции с прагове и изглаждане
  • Визуализация на предвижданя по аудио временни линии

Разширени теми и обработка в реално време

  • Трансфер обучение за сценарии с малко данни
  • Разгръщане на модели с TensorFlow Lite или ONNX
  • Потокова обработка на аудио и разглеждане на забавянето

Развитие на проекти и сценарии за приложение

  • Проектиране на пълна пиплайн: от внасяне до класификация
  • Развиване на доказателствен концепт за наблюдение, контрол на качеството или мониторинг
  • Дневник, уведомяване и интеграция с дашборди или API

Резюме и следващи стъпки

Изисквания

  • Разбиране на концепции за машинно обучение и обучение на модели
  • Опит с програмиране с Python и предварителна обработка на данни
  • Знание на основните принципи на цифровата аудио обработка

Целева група

  • Специалисти по данни
  • Инженери за машинно обучение
  • Изследователи и разработчици в областта на обработката на аудио сигнали
 21 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории