План на курса
Machine Learning Введение
- Видове машинно обучение – с надзор и без надзор
- От статистическо обучение към машинно обучение
- Работният процес на минеране на данни: разбиране на бизнес проблемите, подготвяне на данни, моделиране, внедряване
- Изборът на правилния алгоритъм за задачата
- Преобученост и компромисът между предразсъдък и вариация
Python и преглед на библиотеки за ML
- Защо да се използват програмен език за ML
- Избор между R и Python
- Python бърз курс и Jupyter Notebooks
- Python библиотеки: pandas, NumPy, scikit-learn, matplotlib, seaborn
Тестване и оценяване на ML алгоритми
- Генерализация, преобученост и валидация на модели
- Стратегии за оценка: резервиране, кръстосна валидация, бутстрапинг
- Метрики за регресия: средна грешка, средно квадратна грешка, средно квадратен корен на грешката, средно абсолютно процентно отклонение
- Метрики за класификация: точност, матрица на грешки, небалансирани класи
- Визуализация на производителността на модели: крива на печалба, ROC крива, крива на подем
- Избор на модели и мрежов търсене за настройка
Подготовка на данни
- Импортиране и съхранение на данни в Python
- Експлоатационен анализ и резюме статистика
- Обработка на пропускващи стойности и изключителни стойности
- Стандартизация, нормализиране и трансформация
- Кодиране на качествени данни и обработка на данни с pandas
Алгоритми за класификация
- Бинарна vs многокласова класификация
- Логистична регресия и дискриминантни функции
- Naïve Bayes, k-найблизки съседи
- Решаващи дървета: CART, Random Forests, Bagging, Boosting, XGBoost
- Поддръжка на векторни машини и ядра
- Техники за обучение на ансамбъл
Регресия и числено предсказване
- Наимено квадратни метод и избор на променливи
- Методи за регуларизация: L1, L2
- Полиномна регресия и нелинейни модели
- Регресионни дървета и сплайни
Neural Networks
- Въведение в нейронни мрежи и дълбоко обучение
- Функции за активация, слоеве и обратна пропиляване
- Многослойни перцептриони (MLP)
- Използване на TensorFlow или PyTorch за базов модел на нейронни мрежи
- Нейронни мрежи за класификация и регресия
Прогнозиране на продажби Forecasting и Predictive Analytics
- Времеви редове vs прогнозиране базирано на регресия
- Работа с сезонни и трендови данни
- Създаване на модел за прогнозиране на продажби с ML техники
- Оценка на точността на прогнозата и неопределеността
- Business интерпретация и комуникация на резултатите
Unsupervised Learning
- Техники за кластериране: k-средни, k-медиани, йерархично кластериране, SOMs
- Съкращаване на размерността: PCA, факторен анализ, SVD
- Многомерно мащабиране
Минеране на текст
- Подготовка на текст и токенизация
- Кош с думи, стъблене и лематизация
- Анализ на настроението и честота на думи
- Визуализация на текстови данни с облаци от думи
Системи за препоръки
- Колаборативно филтриране на основата на потребителите и предметите
- Проектиране и оценяване на системи за препоръки
Минеране на асоциативни модели
- Чести набори от предмети и алгоритъм Apriori
- Анализ на кош с продукти и коефициент на подем
Откриване на изключения
- Анализ на екстремни стойности
- Разстоянието и гъстотата на основата методи
- Откриване на изключения в многомерни данни
Machine Learning Кейс студи
- Разбиране на бизнес проблема
- Подготовка на данни и инженерия на характеристики
- Избор на модели и настройка на параметри
- Оценка и представяне на резултатите
- Внедряване
Резюме и следващи стъпки
Изисквания
- Основни познания в концепции за машинно обучение като надзорно и ненадзорно обучение
- Знакомство с програмиране на Python (променливи, цикли, функции)
- Опит с обработка на данни с библиотеки като pandas или NumPy е полезен, но не е задължителен
- Не се очаква предходен опит с напредна моделиране или невронни мрежи
Целева аудитория
- Научни работници в областта на данните
- Аналитици на Business
- Софтуерни инженери и технически специалисти, работейки с данни
Oтзиви от потребители (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Курс - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.