Свържете се с нас

Съдържание и теми, включени в курса

Въведение в екосистемите на големи данни

  • Общ преглед на технологиите и архитектурите за големи данни
  • Пакетна обработка срещу обработка в реално време
  • Стратегии за съхранение на данни за мащабируемост

Усъвършенствана обработка на данни с Apache Spark

  • Оптимизиране на Spark задачи за производителност
  • Усъвършенствани трансформации и действия
  • Работа със структуриран стрийминг

Машинно обучение в мащаб

  • Техники за разпределено обучение на модели
  • Настройка на хиперпараметри върху големи набори от данни
  • Внедряване на модели в среди за големи данни

Дълбоко обучение за големи данни

  • Интегриране на TensorFlow и PyTorch със Spark
  • Разпределени потоци за обучение с дълбоко обучение
  • Случаи на употреба при анализ на изображения, текст и времеви редове

Аналитика в реално време и стрийминг на данни

  • Apache Kafka за приемане на стрийминг данни
  • Рамки за обработка на потоци
  • Мониторинг и предупреждения в системи за реално време

Управление на данни, сигурност и етика

  • Поверителност на данните и изисквания за съответствие
  • Контрол на достъпа и криптиране в системи за големи данни
  • Етични съображения при широкомащабна аналитика

Интегриране на големи данни с бизнес интелигентност

  • Визуализация на данни и създаване на табла за големи данни
  • Свързване на потоци за големи данни с BI инструменти
  • Постигане на бизнес резултати с усъвършенствана аналитика

Обобщение и следващи стъпки

Изисквания

  • Солидно разбиране на концепциите за анализ на данни и статистическо моделиране
  • Опит с инструменти за обработка на данни и езици за програмиране като Python, R или Scala
  • Запознатост с рамки за разпределени изчисления като Hadoop или Spark

Аудитория

  • Data scientists, които се стремят да овладеят широкомащабна обработка на данни и предсказваща аналитика
  • Старши анализатори, които търсят да проектират и внедрят усъвършенствани аналитични работни процеси
  • Професионалисти в НИРД, фокусирани върху иновативни решения, базирани на данни
 42 Часа

Брой участници


Цена за участник

Отзиви от участници (2)

Предстоящи Курсове

Свързани Kатегории