План на курса
Machine Learning Введение
- Видове машинно обучение – с надзор и без надзор
- От статистическо обучение към машинно обучение
- Работният процес на минеране на данни: разбиране на бизнес проблемите, подготвяне на данни, моделиране, внедряване
- Изборът на правилния алгоритъм за задачата
- Преобученост и компромисът между предразсъдък и вариация
Python и преглед на библиотеки за ML
- Защо да се използват програмен език за ML
- Избор между R и Python
- Python бърз курс и Jupyter Notebooks
- Python библиотеки: pandas, NumPy, scikit-learn, matplotlib, seaborn
Тестване и оценяване на ML алгоритми
- Генерализация, преобученост и валидация на модели
- Стратегии за оценка: резервиране, кръстосна валидация, бутстрапинг
- Метрики за регресия: средна грешка, средно квадратна грешка, средно квадратен корен на грешката, средно абсолютно процентно отклонение
- Метрики за класификация: точност, матрица на грешки, небалансирани класи
- Визуализация на производителността на модели: крива на печалба, ROC крива, крива на подем
- Избор на модели и мрежов търсене за настройка
Подготовка на данни
- Импортиране и съхранение на данни в Python
- Експлоатационен анализ и резюме статистика
- Обработка на пропускващи стойности и изключителни стойности
- Стандартизация, нормализиране и трансформация
- Кодиране на качествени данни и обработка на данни с pandas
Алгоритми за класификация
- Бинарна vs многокласова класификация
- Логистична регресия и дискриминантни функции
- Naïve Bayes, k-найблизки съседи
- Решаващи дървета: CART, Random Forests, Bagging, Boosting, XGBoost
- Поддръжка на векторни машини и ядра
- Техники за обучение на ансамбъл
Регресия и числено предсказване
- Наимено квадратни метод и избор на променливи
- Методи за регуларизация: L1, L2
- Полиномна регресия и нелинейни модели
- Регресионни дървета и сплайни
Neural Networks
- Въведение в нейронни мрежи и дълбоко обучение
- Функции за активация, слоеве и обратна пропиляване
- Многослойни перцептриони (MLP)
- Използване на TensorFlow или PyTorch за базов модел на нейронни мрежи
- Нейронни мрежи за класификация и регресия
Прогнозиране на продажби Forecasting и Predictive Analytics
- Времеви редове vs прогнозиране базирано на регресия
- Работа с сезонни и трендови данни
- Създаване на модел за прогнозиране на продажби с ML техники
- Оценка на точността на прогнозата и неопределеността
- Business интерпретация и комуникация на резултатите
Unsupervised Learning
- Техники за кластериране: k-средни, k-медиани, йерархично кластериране, SOMs
- Съкращаване на размерността: PCA, факторен анализ, SVD
- Многомерно мащабиране
Минеране на текст
- Подготовка на текст и токенизация
- Кош с думи, стъблене и лематизация
- Анализ на настроението и честота на думи
- Визуализация на текстови данни с облаци от думи
Системи за препоръки
- Колаборативно филтриране на основата на потребителите и предметите
- Проектиране и оценяване на системи за препоръки
Минеране на асоциативни модели
- Чести набори от предмети и алгоритъм Apriori
- Анализ на кош с продукти и коефициент на подем
Откриване на изключения
- Анализ на екстремни стойности
- Разстоянието и гъстотата на основата методи
- Откриване на изключения в многомерни данни
Machine Learning Кейс студи
- Разбиране на бизнес проблема
- Подготовка на данни и инженерия на характеристики
- Избор на модели и настройка на параметри
- Оценка и представяне на резултатите
- Внедряване
Резюме и следващи стъпки
Изисквания
- Основни познания в концепции за машинно обучение като надзорно и ненадзорно обучение
- Знакомство с програмиране на Python (променливи, цикли, функции)
- Опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
- Не се очаква предходен опит с напредна моделиране или невронни мрежи
Целева аудитория
- Научни работници в областта на данните
- Аналитици на Business
- Софтуерни инженери и технически специалисти, работейки с данни
Oтзиви от потребители (2)
Към екосистемата на машинно обучение спадат не само MLFlow, но и Optuna, hyperops, docker, docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Курс - MLflow
Машинен превод
Къснах се да участвам в тренинг Kubeflow, който беше проведен онлайн. Това обучение ми позволи да утвърдя знанията си за AWS услуги, K8s, всички devOps инструменти около Kubeflow, които са необходимите основи, за да се справя правилно с темата. Исках да благодаря Малявски Марчин за търпеливостта и професионализма му при обучението и съветите за най-добрите практики. Малявски подходи към темата от различни ъгли, различни инструменти за развертане Ansible, EKS kubectl, Terraform. Сега съм напълно убеден, че отивам в правилната област на приложение.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Курс - Kubeflow
Машинен превод