План на курса

Въведение в Data Analysis и Big Data

    Какво прави Big Data "голям"? Скорост, обем, разнообразие, достоверност (VVVV)
Ограничения на традиционната обработка на данни
  • Разпределена обработка
  • Статистически анализ
  • Видове Machine Learning анализи
  • Data Visualization
  • Big Data Роли и отговорности
  • Администратори Разработчици Анализатори на данни

      Languages Използва се за анализ на данни

    R Language Защо R за анализ на данни? Манипулиране на данни, изчисление и графично показване

      Python Защо Python за анализ на данни?
    Манипулиране, обработка, почистване и обработка на данни
  • Подходи към Data Analysis
  • Статистически анализ Анализ на времеви редове Прогнозиране с корелационни и регресионни модели Извод Statistics (оценяване) Описателен Statistics в набори от големи данни (напр. изчисляване на средна стойност)
  • Machine Learning Учене под надзор срещу неконтролирано обучение

      Класификация и групиране
    Оценяване на разходите за конкретни методи
  • Филтриране
  • Обработка на естествен език Обработка на текст
  • Разбиране на смисъла на текста
  • Автоматично генериране на текст
  • Анализ на настроението / анализ на темата
  • Computer Vision Придобиване, обработка, анализиране и разбиране на изображения
  • Реконструиране, интерпретиране и разбиране на 3D сцени
  • Използване на данни за изображения за вземане на решения
  • Big Data Инфраструктура
  • Съхранение на данни Релационни бази данни (SQL) MySQL Postgres Oracle
  • Нерелационни бази данни (№SQL) Касандра
  • MongoDB
  • Neo4jс
  • Разбиране на нюансите Йерархични бази данни

      Обектно-ориентирани бази данни
    Бази данни, ориентирани към документи
  • Графично ориентирани бази данни
  • други
  • Разпределена обработка Hadoop HDFS като разпределена файлова система
  • MapReduce за разпределена обработка
  • Spark All-in-one in-memory cluster computing framework за широкомащабна обработка на данни
  • Структуриран стрийминг
  • Искра SQL
  • Machine Learning библиотеки: MLlib
  • Обработка на графики с GraphX
  • Scalaспособност Публичен облак AWS, Google, Aliyun и др.Частен облак OpenStack, Cloud Foundry и др.
  • Автоматично мащабиране
  • Избор на правилното решение на проблема
  • Бъдещето на Big Data
  • Обобщение и заключение
  • Изисквания

    • Общо разбиране на математиката.
    • Общо разбиране на програмирането.
    • Общо разбиране за бази данни.

    Публика

    • Разработчици / програмисти
    • IT консултанти
     35 Hours

    Брой участници



    Цена за участник

    Oтзиви от потребители (2)

    Свързани Kурсове

    QGIS for Geographic Information System

    21 Hours

    Свързани Kатегории