План на курса

Въведение

    Какво са Large Language Models (LLMs)? LLM срещу традиционни модели на НЛП Преглед на функциите и архитектурата на LLMs Предизвикателства и ограничения на LLMs

Разбиране на LLMs

    Жизненият цикъл на LLM Как работят LLM Основните компоненти на LLM: енкодер, декодер, внимание, вграждания и др.

Приготвяме се да започнем

    Настройване на средата за разработка Инсталиране на LLM като инструмент за разработка, напр. Google Colab, Hugging Face

Работа с LLMs

    Проучване на наличните опции за LLM Създаване и използване на LLM Фина настройка на LLM върху персонализиран набор от данни

Резюмиране на текст

    Разбиране на задачата за обобщаване на текст и неговите приложения Използване на LLM за извлечено и абстрактно обобщаване на текст Оценяване на качеството на генерираните резюмета с помощта на показатели като ROUGE, BLEU и др.

Отговаряне на въпроси

    Разбиране на задачата за отговаряне на въпроси и нейните приложения Използване на LLM за отговор на въпроси от отворен и затворен домейн Оценяване на точността на генерираните отговори с помощта на показатели като F1, EM и др.

Генериране на текст

    Разбиране на задачата за генериране на текст и неговите приложения Използване на LLM за условно и безусловно генериране на текст Контролиране на стила, тона и съдържанието на генерираните текстове с помощта на параметри като температура, top-k, top-p и др.

Интегриране на LLM с други рамки и платформи

    Използване на LLM с PyTorch или TensorFlow Използване на LLM с Flask или Streamlit Използване на LLM с Google Cloud или AWS

Отстраняване на неизправности

    Разбиране на често срещаните грешки и грешки в LLMs Използване на TensorBoard за наблюдение и визуализиране на процеса на обучение Използване на PyTorch Lightning за опростяване на кода за обучение и подобряване на производителността Използване на Hugging Face Datasets за зареждане и предварителна обработка на данните

Обобщение и следващи стъпки

Изисквания

    Разбиране на обработката на естествен език и задълбочено обучение Опит с Python и PyTorch или TensorFlow Основен опит в програмирането

Публика

    Разработчици НЛП ентусиасти Учени по данни
 14 Hours

Брой участници



Цена за участник

Свързани Kурсове

Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation

21 Hours

Свързани Kатегории