План на курса

Въведение в Machine Learning

  • Видове Machine Learning – с наблюдение vs без наблюдение
  • От статистическо обучение към Machine Learning
  • Процес на обработка на данни: разбиране на бизнес проблема, подготовка на данни, моделиране, развертане
  • Избор на подходящ алгоритъм за задачата
  • Преобучение и компромис между предразсъдък и разсеяване

Преглед на Python и ML Библиотеки

  • Защо да се използват програмистични езици за Machine Learning
  • Избор между R и Python
  • Кратък курс за Python и Jupyter Notebooks
  • Библиотеки на Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Тестване и оценяване на ML алгоритми

  • Обобщение, преобучение и валидиране на моделите
  • Стратегии за оценяване: holdout, крос-валидиране, бутстрапинг
  • Метрики за регресия: ME, MSE, RMSE, MAPE
  • Метрики за класификация: точност, матрица на грешки, несъответствие на класовете
  • Визуализация на производителността на моделите: крива на печалба, ROC крива, крива на лифт
  • Избор на модел и мрежов търсене за настройване

Подготовка на данни

  • Импортиране и съхранение на данни в Python
  • Експлоративен анализ и резюме на статистиката
  • Обработка на липсващи стойности и аномалии
  • Стандартизация, нормализация и трансформация
  • Прекодиране на качествени данни и манипулиране на данни с pandas

Алгоритми за класификация

  • Двоична vs многокласова класификация
  • Логистична регресия и дискриминантни функции
  • Naïve Bayes, k-близки съседи
  • Дървета за класификация: CART, случайни горища, Bagging, Boosting, XGBoost
  • Поддържащи вектори и ядра
  • Техники за ансамбъл обучение

Регресия и числена предсказателност

  • Най-малък квадрат и избор на променливи
  • Методи за регуларизация: L1, L2
  • Полиномиална регресия и нелинейни модели
  • Дървета за регресия и сплайни

Невронни мрежи

  • Въведение в невронни мрежи и дълбоко обучение
  • Функции за активация, слоеве и обратно разпространение
  • Многослойни перцептрони (MLP)
  • Използване на TensorFlow или PyTorch за базово моделиране на невронни мрежи
  • Невронни мрежи за класификация и регресия

Прогнозиране на продажби и предиктивна аналитика

  • Времеви редове vs прогнозиране базирано на регресия
  • Обработка на данни с сезонност и тренд
  • Сграждане на модел за прогнозиране на продажби с помощта на ML техники
  • Оценка на точността на прогнозите и несигурност
  • Бизнес интерпретация и комуникация на резултатите

Безнаблюдателно обучение

  • Техники за кластеризация: k-means, k-medoids, йерархична кластеризация, SOMs
  • Снижаване на размерността: PCA, факторен анализ, SVD
  • Многомерно масштабиране

Текстова мина

  • Предварителна обработка на текста и токенизация
  • Bag-of-words, стъмбване и лематизация
  • Анализ на настроенията и честотност на думи
  • Визуализация на текстовите данни с облаци от думи

Системи за препоръки

  • Колаборативно филтриране базирано на потребители и базирано на артикули
  • Проектиране и оценяване на системи за препоръки

Извличане на асоциационни модели

  • Често срещани множества и алгоритъм Apriori
  • Анализ на пазарните кошници и коефициент на лифт

Откриване на аномалии

  • Анализ на екстремни стойности
  • Методи базирани на разстояние и базирани на плътност
  • Откриване на аномалии в данни с висока размерност

Примерен случай на Machine Learning

  • Разбиране на бизнес проблема
  • Предварителна обработка на данни и инженерия на характеристики
  • Избор на модел и настройка на параметри
  • Оценка и представяне на резултатите
  • Развертане

Резюме и следващи стъпки

Изисквания

  • Основни знания за концепциите на машинното обучение, като например надзорвано и ненадзорвано обучение
  • Знание за програмиране на Python (променливи, цикли, функции)
  • Някакъв опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
  • Няма нужда от предишен опит с напреднали модели или невромрежи

Целева аудитория

  • Специалисти по данни
  • Бизнес аналитици
  • Софтуерни инженери и технически специалисти, работащи с данни
 28 часа

Брой участници


Цена за участник

Отзиви от потребители (2)

Предстоящи Курсове

Свързани Kатегории