План на курса

Въведение

разбиране Big Data

Преглед на Spark

Преглед на Python

Преглед на PySpark

  • Разпространение на данни с помощта на устойчива рамка за разпределени набори от данни
  • Разпределяне на изчисления с помощта на Spark API оператори

Настройка Python със Spark

Настройка PySpark

Използване на Amazon Web Services (AWS) EC2 инстанции за Spark

Настройка Databricks

Настройване на AWS EMR клъстер

Изучаване на основите на Python Programming

  • Първи стъпки с Python
  • Използване на тетрадка Jupyter
  • Използване на променливи и прости типове данни
  • Работа със списъци
  • Използване на оператори if
  • Използване на потребителски данни
  • Работа с цикли while
  • Реализиращи функции
  • Работа с класове
  • Работа с файлове и изключения
  • Работа с проекти, данни и API

Изучаване на основите на Spark DataFrame

  • Първи стъпки с Spark DataFrames
  • Внедряване на основни операции със Spark
  • Използване на Groupby и агрегатни операции
  • Работа с времеви марки и дати

Работа по проект на Spark DataFrame Упражнение

Разбиране Machine Learning с MLlib

Работа с MLlib, Spark и Python за Machine Learning

Разбиране на регресиите

  • Изучаване на теорията на линейната регресия
  • Внедряване на код за регресионна оценка
  • Работа върху примерно упражнение за линейна регресия
  • Изучаване на теорията на логистичната регресия
  • Внедряване на код за логистична регресия
  • Работа върху примерно упражнение за логистична регресия

Разбиране на Random Forest и дървета на решения

  • Теория на методите на дървото на обучение
  • Внедряване на дървета за вземане на решения и Random Forest кодове
  • Работа върху образец Random Forest Упражнение за класификация

Работа с K-означава групиране

  • Разбиране на K-означава теорията на групирането
  • Внедряване на код за клъстериране на K-средства
  • Работа върху примерно упражнение за групиране

Работа с Recommender Systems

Внедряване на обработка на естествен език

  • разбиране Natural Language Processing (NLP)
  • Преглед на НЛП инструментите
  • Работа върху примерно НЛП упражнение

Поточно предаване с включен Spark Python

  • Общ преглед Поточно предаване със Spark
  • Пример Spark Streaming Упражнение

Заключителни бележки

Изисквания

  • Общи умения за програмиране

Публика

  • Разработчици
  • ИТ специалисти
  • Учени по данни
 21 Часа

Брой участници


Цена за участник

Oтзиви от потребители (6)

Предстоящи Курсове

Свързани Kатегории