План на курса

Подробна схема на обучение

    Въведение в NLP Разбиране на NLP NLP Frameworks Търговски приложения на NLP Изтриване на данни от мрежата Работа с различни API за извличане на текстови данни Работа и съхраняване на текстови корпуси запазване на съдържание и подходящи метаданни Предимства на използването на интензивен курс на Python и NLTK Практическо разбиране на корпус и набор от данни Защо имаме ли нужда от корпус? Корпусен анализ Типове атрибути на данни Различни файлови формати за корпуси Подготовка на набор от данни за NLP приложения Разбиране на структурата на изречение Компоненти на NLP Разбиране на естествения език Морфологичен анализ - основа, дума, токен, речеви тагове Синтактичен анализ Семантичен анализ Боравене с неяснота Предварителна обработка на текстови данни Корпус - необработен текст Токенизация на изречения Произход за необработен текст Лемизация на необработен текст Спиране на премахване на дума Corpus-raw изречения Word токенизация Word лематизация Работа с матрици Term-Document/Document-Term Токенизация на текст в n-грами и изречения Практическа и персонализирана предварителна обработка Анализиране на текстови данни Основна характеристика на NLP Анализатори и анализиране POS етикетиране и маркери Разпознаване на име на обект N-грами Торба от думи Статистически характеристики на NLP Концепции на линейната алгебра за NLP Вероятностна теория за NLP TF-IDF Векторизация Кодери и декодери Нормализация Вероятностни модели Разширено инженерство на функции и NLP Основи на word2vec Компоненти на модела word2vec Логика на модела word2vec Разширение на концепцията word2vec Приложение на модела word2vec Казус: Приложение на торба с думи: автоматично обобщаване на текст с помощта на опростени и верни алгоритми на Luhn Групиране на документи, класификация и моделиране на теми Групиране на документи и извличане на шаблони (йерархично групиране, k-средни стойности, групиране и т.н.) Сравняване и класифициране на документи с помощта на мерки за TFIDF, Jaccard и косинусови разстояния Класификация на документи с помощта на Naive Bayes и Максимална ентропия Идентифициране на важни текстови елементи Намаляване на размерността: Анализ на основните компоненти, Декомпозиция на единични стойности факторизация на неотрицателна матрица Тематично моделиране и извличане на информация с помощта на латентен семантичен анализ Извличане на обекти, анализ на настроения и усъвършенствано моделиране на теми Положително срещу отрицателно: степен на настроения Теория за реакция на елемент Част от речта маркиране и неговото приложение: намиране на хора, места и организации, споменати в текст Разширено моделиране на теми: Латентно разпределение на Дирихле Казуси Извличане на неструктурирани потребителски рецензии Класификация на настроенията и визуализация на прегледа на продукта Регистри за търсене в извличане на данни за модели на използване Текстова класификация Моделиране на теми

Изисквания

Познаване и осведоменост за принципите на НЛП и оценка на приложението на ИИ в бизнеса

 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (2)

Свързани Kурсове

Smart Robots for Developers

84 Hours

Developing a Bot

14 Hours

Scaling Data Pipelines with Spark NLP

14 Hours

LLMs for Sentiment Analysis

21 Hours

Свързани Kатегории