План на курса

Въведение

    Data Science Ролите на процеса и отговорностите на Data Scientist

Подготовка на средата за разработка

    Библиотеки, рамки, езици и инструменти Локално развитие Съвместно уеб базирано развитие

Събиране на данни

    Различни типове данни Структурирани локални бази данни Конектори за бази данни Общи формати: xlxs, XML, Json, csv, ...
Неструктурирани щраквания, цензура, смартфони
  • API
  • Internet of Things (IoT)
  • Документи, снимки, видео, звуци
  • Казус от практиката: Непрекъснато събиране на големи количества неструктурирани данни
  • Хранилище за данниРелационни бази данни Нерелационни бази данни Hadoop: Разпределена файлова система (HDFS) Spark: Resilient Distributed Dataset (RDD) Облачно съхранение
  • Подготовка на данни
  • Поглъщане, избор, почистване и трансформация Гарантиране на качеството на данните - коректност, значимост и сигурност Доклади за изключения

      Languages използвани за подготовка, обработка и анализ

    R език Въведение в R Манипулиране на данни, изчисление и графично показване

      Python Въведение в Python

    Манипулиране, обработка, почистване и обработка на данни

      Анализ на данни
    Проучвателен анализ Основни статистики Чернови визуализации Разбиране на данните
  • Причинност
  • Характеристики и трансформации
  • Machine Learning Надзорни срещу ненадзорни

      Кога какъв модел да използвате
    Natural Language Processing (NLP)
  • Data Visualization
  • Най-добри практики Избор на правилната диаграма за правилните данни Цветови палети Преминаване на следващото ниво Табла за управление Интерактивни визуализации
  • Разказване на истории с данни
  • Обобщение и заключение
  • Изисквания

    • Общо разбиране на концепциите за бази данни
    • Основно разбиране на статистиката
     35 Hours

    Брой участници



    Цена за участник

    Oтзиви от потребители (2)

    Свързани Kатегории