План на курса

Въведение в Retrieval-Augmented Generation (RAG)

  • Кой е RAG и защо е важен за корпоративната ИИ
  • Компоненти на система RAG: извлекач, генератор, хранилище на документи
  • Сравнение с самостоятелни LLMs и векторно търсене

Настройка на пиплайна RAG

  • Инсталиране и конфигуриране на Haystack или подобни рамки
  • Внасяне и предварителна обработка на документи
  • Свързване на извлекачи с векторни бази данни (например, FAISS, Pinecone)

Файн-тунинг на извлекача

  • Обучение на гъсти извлекачи с помощта на специфични данни за домейна
  • Използване на трансформери за предложения и контрастно обучение
  • Оценяване на качеството на извлекача с точност top-k

Файн-тунинг на генератора

  • Избор на базови модели (например, BART, T5, FLAN-T5)
  • Насоки за обучение срещу контролирано обучение
  • Методи LoRA и PEFT за ефективни обновления

Оценяване и оптимизация

  • Метрики за оценяване на производителността на RAG (например, BLEU, EM, F1)
  • Закъснение, качество на извличането и намаляване на халюцинации
  • Следване на експериментите и итеративно подобрение

Разработка и интеграция в реалния свят

  • Разработка на RAG вътрешни търсачки и чатботи
  • Разглеждане на безопасност, достъп до данни и управление
  • Интеграция с API, дашбордове или портали за знания

Примерни изследвания и добри практики

  • Корпоративни случаи в финансовия, здравния и правния сектор
  • Управление на смяна на домейна и обновления на базата данни
  • Бъдещи направления в системи с ретривал-оугментирани LLM

Резюме и следващи стъпки

Изисквания

  • Разбиране в концепции за обработка на естествен език (NLP)
  • Опит с трансформерни модели за езици
  • Знание на Python и базови процесове за машинно обучение

Целева аудитория

  • Инженери за обработка на естествен език
  • Екипи за управление на знания
 14 часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории