План на курса
Въведение в Machine Learning
- Видове Machine Learning – с наблюдение vs без наблюдение
- От статистическо обучение към Machine Learning
- Процес на обработка на данни: разбиране на бизнес проблема, подготовка на данни, моделиране, развертане
- Избор на подходящ алгоритъм за задачата
- Преобучение и компромис между предразсъдък и разсеяване
Преглед на Python и ML Библиотеки
- Защо да се използват програмистични езици за Machine Learning
- Избор между R и Python
- Кратък курс за Python и Jupyter Notebooks
- Библиотеки на Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Тестване и оценяване на ML алгоритми
- Обобщение, преобучение и валидиране на моделите
- Стратегии за оценяване: holdout, крос-валидиране, бутстрапинг
- Метрики за регресия: ME, MSE, RMSE, MAPE
- Метрики за класификация: точност, матрица на грешки, несъответствие на класовете
- Визуализация на производителността на моделите: крива на печалба, ROC крива, крива на лифт
- Избор на модел и мрежов търсене за настройване
Подготовка на данни
- Импортиране и съхранение на данни в Python
- Експлоративен анализ и резюме на статистиката
- Обработка на липсващи стойности и аномалии
- Стандартизация, нормализация и трансформация
- Прекодиране на качествени данни и манипулиране на данни с pandas
Алгоритми за класификация
- Двоична vs многокласова класификация
- Логистична регресия и дискриминантни функции
- Naïve Bayes, k-близки съседи
- Дървета за класификация: CART, случайни горища, Bagging, Boosting, XGBoost
- Поддържащи вектори и ядра
- Техники за ансамбъл обучение
Регресия и числена предсказателност
- Най-малък квадрат и избор на променливи
- Методи за регуларизация: L1, L2
- Полиномиална регресия и нелинейни модели
- Дървета за регресия и сплайни
Невронни мрежи
- Въведение в невронни мрежи и дълбоко обучение
- Функции за активация, слоеве и обратно разпространение
- Многослойни перцептрони (MLP)
- Използване на TensorFlow или PyTorch за базово моделиране на невронни мрежи
- Невронни мрежи за класификация и регресия
Прогнозиране на продажби и предиктивна аналитика
- Времеви редове vs прогнозиране базирано на регресия
- Обработка на данни с сезонност и тренд
- Сграждане на модел за прогнозиране на продажби с помощта на ML техники
- Оценка на точността на прогнозите и несигурност
- Бизнес интерпретация и комуникация на резултатите
Безнаблюдателно обучение
- Техники за кластеризация: k-means, k-medoids, йерархична кластеризация, SOMs
- Снижаване на размерността: PCA, факторен анализ, SVD
- Многомерно масштабиране
Текстова мина
- Предварителна обработка на текста и токенизация
- Bag-of-words, стъмбване и лематизация
- Анализ на настроенията и честотност на думи
- Визуализация на текстовите данни с облаци от думи
Системи за препоръки
- Колаборативно филтриране базирано на потребители и базирано на артикули
- Проектиране и оценяване на системи за препоръки
Извличане на асоциационни модели
- Често срещани множества и алгоритъм Apriori
- Анализ на пазарните кошници и коефициент на лифт
Откриване на аномалии
- Анализ на екстремни стойности
- Методи базирани на разстояние и базирани на плътност
- Откриване на аномалии в данни с висока размерност
Примерен случай на Machine Learning
- Разбиране на бизнес проблема
- Предварителна обработка на данни и инженерия на характеристики
- Избор на модел и настройка на параметри
- Оценка и представяне на резултатите
- Развертане
Резюме и следващи стъпки
Изисквания
- Основни знания за концепциите на машинното обучение, като например надзорвано и ненадзорвано обучение
- Знание за програмиране на Python (променливи, цикли, функции)
- Някакъв опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
- Няма нужда от предишен опит с напреднали модели или невромрежи
Целева аудитория
- Специалисти по данни
- Бизнес аналитици
- Софтуерни инженери и технически специалисти, работащи с данни
Отзиви от потребители (2)
Към екосистемата на машинно обучение спадат не само MLFlow, но и Optuna, hyperops, docker, docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Курс - MLflow
Машинен превод
Къснах се да участвам в тренинг Kubeflow, който беше проведен онлайн. Това обучение ми позволи да утвърдя знанията си за AWS услуги, K8s, всички devOps инструменти около Kubeflow, които са необходимите основи, за да се справя правилно с темата. Исках да благодаря Малявски Марчин за търпеливостта и професионализма му при обучението и съветите за най-добрите практики. Малявски подходи към темата от различни ъгли, различни инструменти за развертане Ansible, EKS kubectl, Terraform. Сега съм напълно убеден, че отивам в правилната област на приложение.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Курс - Kubeflow
Машинен превод