План на курса

Въведение в Cursor за данни и ML работни процеси

  • Общ преглед на ролята на Cursor в инженерията на данни и ML
  • Настройка на околната среда и свързване на източници с данни
  • Разбиране на AI-помощен код в тетрадки

Ускоряване на разработката на тетрадки

  • Създаване и управление на Jupyter тетрадки в Cursor
  • Използване на AI за завършване на код, изследване на данни и визуализация
  • Документиране на експерименти и поддържане на възпроизводимост

Създаване на ETL и конвейери за характеристики

  • Генериране и рефакториране на ETL скриптове с помощ на AI
  • Структуриране на конвейерите за характеристики за разгъната
  • Контрол на версии на компоненти и набори от данни в конвейерите

Обучаване и оценка на модели с Cursor

  • Създаване на код за обучаване на модели и оценки
  • Интегриране на предварителна обработка на данни и тюнинг на хиперпараметри
  • Поддържане на възпроизводимостта на моделите в различни околнини

Интегриране на Cursor в конвейерите за MLOps

  • Свързване на Cursor с регистри за модели и CI/CD работни процеси
  • Използване на AI-помощни скриптове за автоматично повторно обучаване и разгъната
  • Мониторинг на жизнен цикъл на модели и отслежване на версии

AI-помощна документация и съобщения

  • Генериране на вградена документация за конвейерите с данни
  • Създаване на резюмета и отчети за прогрес на експерименти
  • Подобряване на сътрудничеството в екипите чрез документация, свързана с контекста

Възпроизводимост и управление в ML проектите

  • Провеждане на най-добрите практики за линията на данните и моделите
  • Поддържане на управлението и съответствието с помощ на AI-генериран код
  • Аудит на решенията на AI и поддържане на проследимост

Подобряване на продуктивността и бъдещи приложения

  • Прилагане на стратегии за подка兰 (prompts) за по-бърза итерация
  • Изследване на възможности за автоматизация в операциите с данни
  • Подготвка за бъдещи подобрения в интеграцията между Cursor и ML

Резюме и следващи стъпки

Изисквания

  • Опит с анализ на данни или машинно обучение на база Python
  • Разбиране на работните процеси за ETL и обучаване на модели
  • Познаване на системи за контрол на версии и инструменти за конвейери с данни

Целева група

  • Специалисти по данни, които строят и подобряват ML тетрадки
  • Инженери за машинно обучение, проектиращи конвейери за обучаване и инференция
  • Специалисти по MLOps, управяващи разгъната на модели и възпроизводимост
 14 часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории