План на курса
Въведение в Machine Learning
- Видове Machine Learning – с наблюдение vs без наблюдение
- От статистическо обучение към Machine Learning
- Процес на обработка на данни: разбиране на бизнес проблема, подготовка на данни, моделиране, развертане
- Избор на подходящ алгоритъм за задачата
- Преобучение и компромис между предразсъдък и разсеяване
Преглед на Python и ML Библиотеки
- Защо да се използват програмистични езици за Machine Learning
- Избор между R и Python
- Кратък курс за Python и Jupyter Notebooks
- Библиотеки на Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Тестване и оценяване на ML алгоритми
- Обобщение, преобучение и валидиране на моделите
- Стратегии за оценяване: holdout, крос-валидиране, бутстрапинг
- Метрики за регресия: ME, MSE, RMSE, MAPE
- Метрики за класификация: точност, матрица на грешки, несъответствие на класовете
- Визуализация на производителността на моделите: крива на печалба, ROC крива, крива на лифт
- Избор на модел и мрежов търсене за настройване
Подготовка на данни
- Импортиране и съхранение на данни в Python
- Експлоративен анализ и резюме на статистиката
- Обработка на липсващи стойности и аномалии
- Стандартизация, нормализация и трансформация
- Прекодиране на качествени данни и манипулиране на данни с pandas
Алгоритми за класификация
- Двоична vs многокласова класификация
- Логистична регресия и дискриминантни функции
- Naïve Bayes, k-близки съседи
- Дървета за класификация: CART, случайни горища, Bagging, Boosting, XGBoost
- Поддържащи вектори и ядра
- Техники за ансамбъл обучение
Регресия и числена предсказателност
- Най-малък квадрат и избор на променливи
- Методи за регуларизация: L1, L2
- Полиномиална регресия и нелинейни модели
- Дървета за регресия и сплайни
Невронни мрежи
- Въведение в невронни мрежи и дълбоко обучение
- Функции за активация, слоеве и обратно разпространение
- Многослойни перцептрони (MLP)
- Използване на TensorFlow или PyTorch за базово моделиране на невронни мрежи
- Невронни мрежи за класификация и регресия
Прогнозиране на продажби и предиктивна аналитика
- Времеви редове vs прогнозиране базирано на регресия
- Обработка на данни с сезонност и тренд
- Сграждане на модел за прогнозиране на продажби с помощта на ML техники
- Оценка на точността на прогнозите и несигурност
- Бизнес интерпретация и комуникация на резултатите
Безнаблюдателно обучение
- Техники за кластеризация: k-means, k-medoids, йерархична кластеризация, SOMs
- Снижаване на размерността: PCA, факторен анализ, SVD
- Многомерно масштабиране
Текстова мина
- Предварителна обработка на текста и токенизация
- Bag-of-words, стъмбване и лематизация
- Анализ на настроенията и честотност на думи
- Визуализация на текстовите данни с облаци от думи
Системи за препоръки
- Колаборативно филтриране базирано на потребители и базирано на артикули
- Проектиране и оценяване на системи за препоръки
Извличане на асоциационни модели
- Често срещани множества и алгоритъм Apriori
- Анализ на пазарните кошници и коефициент на лифт
Откриване на аномалии
- Анализ на екстремни стойности
- Методи базирани на разстояние и базирани на плътност
- Откриване на аномалии в данни с висока размерност
Примерен случай на Machine Learning
- Разбиране на бизнес проблема
- Предварителна обработка на данни и инженерия на характеристики
- Избор на модел и настройка на параметри
- Оценка и представяне на резултатите
- Развертане
Резюме и следващи стъпки
Изисквания
- Основни знания за концепциите на машинното обучение, като например надзорвано и ненадзорвано обучение
- Знание за програмиране на Python (променливи, цикли, функции)
- Някакъв опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
- Няма нужда от предишен опит с напреднали модели или невромрежи
Целева аудитория
- Специалисти по данни
- Бизнес аналитици
- Софтуерни инженери и технически специалисти, работащи с данни
Отзиви от потребители (2)
МЛ екосистемата включва не само MLFlow, но и Optuna, Hyperopt, Docker и Docker-Compose.
Guillaume GAUTIER - OLEA MEDICAL
Курс - MLflow
Машинен превод
Ужасно ми хареса да участвам в обучението по Kubeflow, което се провежда на разстояние. Това обучение ми позволи да утвърдя знанията си за услугите AWS, K8s и всички инструменти DevOps около Kubeflow, които са необходимата база, за да се справя правилно с темата. Искам да благодаря на Малауски Марцин за неговото търпение и професионализъм при обучението и съветите му за най-добри практики. Малауски разглежда темата от различни ъгли, използвайки различни инструменти за развиване като Ansible, EKS kubectl, Terraform. Сега съм напълно убеден, че влизам в правилната област на приложение.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Курс - Kubeflow
Машинен превод