План на курса
Модул 1: Основи на Python за ML работни процеси
• Стартиране на курса и подготвка на околната среда
Съгласуване на цели и създаване на воспроизводима ML работна среда с Python
• Основи на Python за ML (ускорен обзор)
Разглеждане на синтаксиса, контролирането на потока, функциите и патерните, често използваните в ML кодовете
• Датови структури за ML
Списъци, речници, множества и двойки за характеристики, етикети и метаданни
• Компрехензии и функционални инструменти
Описване на преобразования с компрехензии и функции високого реда
• Обектно-ориентиран Python за ML разработчици
Класове, методи, композиция и практически дизайни
• dataclasses и лесен модел
Типизираните контейнери за конфигурация, примери и резултати
• Декоратори и мениджъри на контекст
Определяне на времето, кеширане, логиране и патерни на изпълнение с ресурси
• Работа със файлове и пътища
Робустно управление на набори от данни и формати за сериализация
• Искключения и защитено програмиране
Писане на ML скриптове, които се провалят безопасно и прозрачно
• Модули, пакети и структура на проекта
Организиране на ML кодове за повторно използване
• Типизация и качеството на кода
Типизиране, документация и линт-дружелюбна структура
Модул 2: Числова Python, SciPy и управление на данни
• Основи на NumPy за векторизирано изчисление
Ефективни операции с масиви и кодиране с внимание към производителността
• Индексиране, създаване на сегменти, разпространение и форми
Безопасно манипулиране на тензори и разсъждения относно формата
• Основи на линейната алгебра с NumPy и SciPy
Стабилни операции с матрици и разлагания, използвано в ML
• Глед на SciPy
Статистика, оптимизация, подравняване на криви и разрежени матрици
• Pandas за табуларни данни в ML
Очистване, обединяване, агрегиране и подготовка на набори от данни
• Глед на scikit-learn
Интерфейс на оценяващия, линии и воспроизводими работни процеси
• Основи на визуализацията
Диагностика на графики за изследване на данни и поведение на модела
Модул 3: Програмни патерни за създаване на ML приложения
• От записна книга до поддържан проект
Разрефакториране на изследователски код в структурирани пакети
• Управление на конфигурацията
Външни параметри и валидация при стартиране
• Логиране, предупреждения и наблюдаемост
Структурирано логиране за отладки на ML системи
• Повторно използваеми компоненти с OOP и композиция
Проектиране на разширителни трансформатори и предиктори
• Практични патерни на дизайна
Патерни на Pipeline, Factory, Registry, Strategy и Adapter
• Управление на валидацията на данни и схемата
Предотвратяване на скрити проблеми с данни
• Производителност и профилиране
Определяне на ботлнековете и прилагане на техники за оптимизация
• Вход и изход на модели и интерфейси за предвиждане
Безопасно съхранение и чисти интерфейси за прогнози
• Мини-проекти от край до край
Производствен стил на ML линия с конфигурация и логиране
Модул 4: Статистично учене за табуларни, текстови и изображения
• Основи на оценката
Разделени за обучение и валидация, честа кръстосаната валидация и метрики, съответстващи на бизнеса
• Продвинато табуларно ML
Регуляризирани GLM, групирани дървета и предварителна обработка без утечки
• Калибриране и неизвестност
Platt калибриране, изотонна регресия, бутстрап и конформни прогнози
• Класически методи на NLP
Торговски компромиси при токенизирането, TF-IDF, линейни модели и Naive Bayes
• Модели на темите
Основи на LDA и практически ограничения
• Класическа компютърна визия
HOG, PCA и базиран на характеристики работни процеси
• Анализ на грешки
Детекция на предвземаности, шум в етикетите и нерелевантни корелации
• Лабораторни упражнения
Табуларна линия без утечки
Сравнение и интерпретация на текстов базов модел
Класически визуален базов модел с анализ на структурирани неуспехи
Модул 5: Невронни мрежи за табуларни, текстови и изображения
• Освоение на трениращата цикличност
Чисти PyTorch цикли с AMP, клипване и воспроизводимост
• Оптимизация и регуляризация
Инициализация, нормализация, оптимизатори и планирирачи
• Смешана точност и мащабиране
Аккумулиране на градиенти и стратегии за чекпойнт
• Табуларни невронни мрежи
Категорични вграждания, кръстосани характеристики и анализа на аболюти
• Текстови невронни мрежи
Вграждания, CNN, BiLSTM или GRU и обработка на последователности
• Визуални невронни мрежи
Фундаментални на CNN и архитектури в стил на ResNet
• Лабораторни упражнения
Повторно използваема рамка за обучение
Сравнение между табуларна NN и boosting
CNN с аугментация и експерименти с планиране
Модул 6: Продвинати невронни архитектури
• Стратегии за прехвърляне на обучение
Патерни за замразяване и размразяване, дискриминационни темпи на учене
• Архитектури на трансформатори за текст
Интерни на самозахранването и подходи за файнтюнинг
• Визуални спънбекове и гъсто предсказване
ResNet, EfficientNet, Vision Transformers и концепции на U-Net
• Продвинати табуларни архитектури
TabTransformer, FT-Transformer и дълбоки и кръстосани мрежи
• Разсъждения относно временния ред
Временни разделяния и детекция на ковариация
• PEFT и техники за ефективност
LoRA, дистилация и компромиси при квантизиране
• Лабораторни упражнения
Файнтюнинг на предварително обучен текстов трансформатор
Файнтюнинг на предварително обучен визуален модел
Сравнение между табуларен трансформатор и GBDT
Модул 7: Генеративни ИИ системи
• Основи на подтикването
Структурирано подтикване и контролирано генериране
• Основи на LLM
Токенизиране, усъвършенстване на инструкции и преодоляване на холюсинация
• Генериране с подкрепа на извличане
Чанки, вграждания, хибридно търсене и оценки на метрики
• Стратегии за файнтюнинг
LoRA и QLoRA с контроли за качеството на данни
• Дифузионни модели
Интуиция за латентна дифузия и практически адаптации
• Синтетични табуларни данни
CTGAN и разсъждения за поверителност
• Лабораторни упражнения
Производствен стил на мини-приложение RAG
Валидиране на структурирани изходи с изпълнение на схема
Опционално дифузионно експериментиране
Модул 8: ИИ агенти и MCP
• Дизайн на агентната цикличност
Наблюдаване, планиране, действие, рефлексия и съхранение
• Архитектури на агенти
ReAct, план и изпълнение, координация на мулти-агенти
• Управление на паметта
Епизодично, семантично и рабочо поле
• Интеграция на инструменти и безопасност
Договори за инструменти, песок и защита от инъекции на подтиквания
• Оценки на рамки
Воспроизводими следи, набори от задачи и регресионни тестове
• MCP и протоколен базирана интероперабилност
Проектиране на MCP сървъри с безопасна експозиция на инструменти
• Лабораторни упражнения
Създаване на агент от нула
Експозиция на инструменти чрез MCP-стил сървър
Създаване на оценка със съображения за безопасност
Изисквания
Участниците трябва да имат активни познания в програмирането с Python.
Тази програма е предназначена за технически професионалисти с intermediat до продвинат ниво.
Отзиви от потребители (2)
МЛ екосистемата включва не само MLFlow, но и Optuna, Hyperopt, Docker и Docker-Compose.
Guillaume GAUTIER - OLEA MEDICAL
Курс - MLflow
Машинен превод
Ужасно ми хареса да участвам в обучението по Kubeflow, което се провежда на разстояние. Това обучение ми позволи да утвърдя знанията си за услугите AWS, K8s и всички инструменти DevOps около Kubeflow, които са необходимата база, за да се справя правилно с темата. Искам да благодаря на Малауски Марцин за неговото търпение и професионализъм при обучението и съветите му за най-добри практики. Малауски разглежда темата от различни ъгли, използвайки различни инструменти за развиване като Ansible, EKS kubectl, Terraform. Сега съм напълно убеден, че влизам в правилната област на приложение.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Курс - Kubeflow
Машинен превод