Съдържание и теми, включени в курса
Въведение в Machine Learning
- Видове Machine Learning – с наблюдение vs без наблюдение
- От статистическо обучение към Machine Learning
- Процес на обработка на данни: разбиране на бизнес проблема, подготовка на данни, моделиране, развертане
- Избор на подходящ алгоритъм за задачата
- Преобучение и компромис между предразсъдък и разсеяване
Преглед на Python и ML Библиотеки
- Защо да се използват програмистични езици за Machine Learning
- Избор между R и Python
- Кратък курс за Python и Jupyter Notebooks
- Библиотеки на Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Тестване и оценяване на ML алгоритми
- Обобщение, преобучение и валидиране на моделите
- Стратегии за оценяване: holdout, крос-валидиране, бутстрапинг
- Метрики за регресия: ME, MSE, RMSE, MAPE
- Метрики за класификация: точност, матрица на грешки, несъответствие на класовете
- Визуализация на производителността на моделите: крива на печалба, ROC крива, крива на лифт
- Избор на модел и мрежов търсене за настройване
Подготовка на данни
- Импортиране и съхранение на данни в Python
- Експлоративен анализ и резюме на статистиката
- Обработка на липсващи стойности и аномалии
- Стандартизация, нормализация и трансформация
- Прекодиране на качествени данни и манипулиране на данни с pandas
Алгоритми за класификация
- Двоична vs многокласова класификация
- Логистична регресия и дискриминантни функции
- Naïve Bayes, k-близки съседи
- Дървета за класификация: CART, случайни горища, Bagging, Boosting, XGBoost
- Поддържащи вектори и ядра
- Техники за ансамбъл обучение
Регресия и числена предсказателност
- Най-малък квадрат и избор на променливи
- Методи за регуларизация: L1, L2
- Полиномиална регресия и нелинейни модели
- Дървета за регресия и сплайни
Невронни мрежи
- Въведение в невронни мрежи и дълбоко обучение
- Функции за активация, слоеве и обратно разпространение
- Многослойни перцептрони (MLP)
- Използване на TensorFlow или PyTorch за базово моделиране на невронни мрежи
- Невронни мрежи за класификация и регресия
Прогнозиране на продажби и предиктивна аналитика
- Времеви редове vs прогнозиране базирано на регресия
- Обработка на данни с сезонност и тренд
- Сграждане на модел за прогнозиране на продажби с помощта на ML техники
- Оценка на точността на прогнозите и несигурност
- Бизнес интерпретация и комуникация на резултатите
Безнаблюдателно обучение
- Техники за кластеризация: k-means, k-medoids, йерархична кластеризация, SOMs
- Снижаване на размерността: PCA, факторен анализ, SVD
- Многомерно масштабиране
Текстова мина
- Предварителна обработка на текста и токенизация
- Bag-of-words, стъмбване и лематизация
- Анализ на настроенията и честотност на думи
- Визуализация на текстовите данни с облаци от думи
Системи за препоръки
- Колаборативно филтриране базирано на потребители и базирано на артикули
- Проектиране и оценяване на системи за препоръки
Извличане на асоциационни модели
- Често срещани множества и алгоритъм Apriori
- Анализ на пазарните кошници и коефициент на лифт
Откриване на аномалии
- Анализ на екстремни стойности
- Методи базирани на разстояние и базирани на плътност
- Откриване на аномалии в данни с висока размерност
Примерен случай на Machine Learning
- Разбиране на бизнес проблема
- Предварителна обработка на данни и инженерия на характеристики
- Избор на модел и настройка на параметри
- Оценка и представяне на резултатите
- Развертане
Резюме и следващи стъпки
Изисквания
- Основни знания за концепциите на машинното обучение, като например надзорвано и ненадзорвано обучение
- Знание за програмиране на Python (променливи, цикли, функции)
- Някакъв опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
- Няма нужда от предишен опит с напреднали модели или невромрежи
Целева аудитория
- Специалисти по данни
- Бизнес аналитици
- Софтуерни инженери и технически специалисти, работащи с данни
Отзиви от участници (3)
Много ми хареса краят, когато прекарахме време, разглеждайки CHAT GPT. Залата не беше най-добре организирана за това – вместо едно голямо стола, няколко по-малки щеше да помогне, за да се разделим на малки групи и да мислим съвместно.
Nola - Laramie County Community College
Курс - Artificial Intelligence (AI) Overview
Машинен превод
Работата с първични принципи по фокусиран начин и прилагане на кейс студии вътре в същия ден
Maggie Webb - Department of Jobs, Regions, and Precincts
Курс - Artificial Neural Networks, Machine Learning, Deep Thinking
Машинен превод
Че се прилага реални данни на компаниите. Тренърът имаше много добър подход, подказвайки участниците да участват и конкурират.
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Курс - Applied AI from Scratch in Python
Машинен превод