Свържете се с нас

Съдържание и теми, включени в курса

Въведение

Този раздел предоставя общо въведение в това кога да използвате „машинно обучение“, какво трябва да се има предвид и какво означава всичко това, включително предимствата и недостатъците. Типове данни (структурирани/неструктурирани, статични/поточни), валидност/обем на данните, аналитика, водена от данни, в противовес на аналитикa, водена от потребителя, статистически модели срещу модели на машинно обучение/ предизвикателствата при неконтролирано обучение, компромисът между смещение и вариация, итерация/оценка, подходи за крос-валидация, контролирано/неконтролирано/усилвателно обучение.

ОСНОВНИ ТЕМИ

1. Разбиране на Наивен Бейс

  • Основни концепции на байесовите методи
  • Вероятност
  • Съвместна вероятност
  • Условна вероятност с теоремата на Бейс
  • Алгоритъмът за Наивен Бейс
  • Класификация с Наивен Бейс
  • Оценителят на Лаплас
  • Използване на числови функции с Наивен Бейс

2. Разбиране на дърветата на вземане на решения

  • Разделяй и владей
  • Алгоритъмът на дървото на вземане на решения C5.0
  • Избор на най-доброто разделяне
  • Прореждане на дървото на вземане на решения

3. Разбиране на невронните мрежи

  • От биологични до изкуствени неврони
  • Функции за активиране
  • Топология на мрежата
  • Брой слоеве
  • Посока на пътуване на информацията
  • Брой възли в всеки слой
  • Обучаване на невронни мрежи чрез обратно разпространение
  • Дълбоко обучение

4. Разбиране на машините с поддържащи вектори

  • Класификация с хиперравнини
  • Намиране на максималната граница
  • Случаят на линейно разделими данни
  • Случаят на неллинейно разделими данни
  • Използване на ядра за нелинейни пространства

5. Разбиране на кластеризацията

  • Кластеризация като задача за машинно обучение
  • Алгоритъмът k-средни за кластеризация
  • Използване на разстояние за присвояване и актуализиране на клъстери
  • Избор на подходящ брой клъстери

6. Оценяване на производителността за класификация

  • Работа с данни за предсказания на класификация
  • По-внимателен поглед върху матриците на объркване
  • Използване на матрици на объркване за измерване на производителност
  • Задълбочена точност – други показатели за производителност
  • Статистиката kappa
  • Чувствителност и специфичност
  • Точност и припомняне
  • Мерката F
  • Визуализиране на компромисите на производителността
  • ROC криви
  • Оценяване на бъдещата производителност
  • Методът на поддръжката
  • Крос-валидация
  • Бутстрап изваждане

7. Омекотяване на стандартните модели за по-добра производителност

  • Използване на caret за автоматично омекотяване на параметрите
  • Създаване на просто омекотено модел
  • Персонализиране на процеса на омекотяване
  • Подобряване на производителността на модела чрез мета-обучение
  • Разбиране на ансамблите
  • Бэгинг (Bagging)
  • Бустинг (Boosting)
  • Случайни гори
  • Обучаване на случайни гори
  • Оценяване на производителността на случайните гори

ВТОРОСТЕПЕННИ ТЕМИ

8. Разбиране на класификацията чрез най-близките съседи

  • Алгоритъмът kNN
  • Изчисляване на разстояние
  • Избор на подходящо k
  • Подготовка на данни за употреба с kNN
  • Защо алгоритъмът kNN е мързелив?

9. Разбиране на правилата за класификация

  • Отделно и владей
  • Алгоритъмът на едно правило
  • Алгоритъмът RIPPER
  • Правилата от дърветата на вземане на решения

10. Разбиране на регресията

  • Проста линейна регресия
  • Оценка на най-малките квадрати
  • Корелации
  • Множествена линейна регресия

11. Разбиране на дърветата за регресия и моделните дървета

  • Добавяне на регресия към дърветата

12. Разбиране на правилата за асоциация

  • Алгоритъмът Apriori за научаване на правила за асоциация
  • Измерване на интереса към правилото – поддръжка и увереност
  • Създаване на набор от правила с принципа на Apriori

Допълнителни материали

  • Spark/PySpark/MLlib и многораменни бандачи

Изисквания

Знания по Python

 21 Часа

Брой участници


Цена за участник

Отзиви от участници (7)

Предстоящи Курсове

Свързани Kатегории