План на курса

Въведение

разбиране Big Data

Преглед на Spark

Преглед на Python

Преглед на PySpark

    Разпространение на данни с помощта на устойчиви разпределени набори от данни Framework Разпределение на изчисления с помощта на Spark API оператори

Настройка Python със Spark

Настройка PySpark

Използване на Amazon Web Services (AWS) EC2 инстанции за Spark

Настройка Databricks

Настройване на AWS EMR клъстер

Изучаване на основите на Python програмирането

    Първи стъпки с Python Използване на Jupyter Notebook Използване на променливи и прости типове данни Работа със списъци Използване на оператори if Използване на потребителски входове Работа с цикли while Внедряване на функции Работа с класове Работа с файлове и изключения Работа с проекти, данни и API

Изучаване на основите на Spark DataFrame

    Първи стъпки с Spark DataFrames Изпълнение на основни операции със Spark Използване на Groupby и агрегатни операции Работа с времеви клейма и дати

Работа по проект на Spark DataFrame Упражнение

Разбиране Machine Learning с MLlib

Работа с MLlib, Spark и Python за машинно обучение

Разбиране на регресиите

    Изучаване на теорията на линейната регресия Внедряване на код за оценка на регресия Работа върху примерно упражнение за линейна регресия Учене на теорията на логистичната регресия Внедряване на код за логистична регресия Работа върху примерно упражнение за логистична регресия

Разбиране на Random Forest и дървета на решения

    Теория на методите на дървото за обучение Прилагане на дървета на решения и Random Forest кодове Работа върху извадка Random Forest Упражнение за класификация

Работа с K-означава групиране

    Разбиране на теорията за клъстериране на K-означава Внедряване на код за клъстериране на K-означава Работа върху примерно упражнение за клъстериране

Работа с Recommender Systems

Внедряване на обработка на естествен език

    Разбиране Natural Language Processing (NLP) Преглед на инструментите на НЛП, работещи върху примерно НЛП упражнение

Поточно предаване с включен Spark Python

    Общ преглед Поточно предаване с Spark Пример Spark Streaming Упражнение

Заключителни бележки

Изисквания

  • Общи умения за програмиране

Публика

  • Разработчици
  • ИТ специалисти
  • Учени по данни
 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (5)

Свързани Kурсове

Kivy: Building Android Apps with Python

7 Hours

Свързани Kатегории