План на курса

Въведение

    Data Science Ролите на процеса и отговорностите на Data Scientist

Подготовка на средата за разработка

    Библиотеки, рамки, езици и инструменти Локално развитие Съвместно уеб базирано развитие

Събиране на данни

    Различни типове данни Структурирани локални бази данни Конектори за бази данни Общи формати: xlxs, XML, Json, csv, ...
Неструктурирани щраквания, цензура, смартфони
  • API
  • Internet of Things (IoT)
  • Документи, снимки, видео, звуци
  • Казус от практиката: Непрекъснато събиране на големи количества неструктурирани данни
  • Хранилище за данниРелационни бази данни Нерелационни бази данни Hadoop: Разпределена файлова система (HDFS) Spark: Resilient Distributed Dataset (RDD) Облачно съхранение
  • Подготовка на данни
  • Поглъщане, избор, почистване и трансформация Гарантиране на качеството на данните - коректност, значимост и сигурност Доклади за изключения

      Languages използвани за подготовка, обработка и анализ

    R език Въведение в R Манипулиране на данни, изчисление и графично показване

      Python Въведение в Python

    Манипулиране, обработка, почистване и обработка на данни

      Анализ на данни
    Проучвателен анализ Основни статистики Чернови визуализации Разбиране на данните
  • Причинност
  • Характеристики и трансформации
  • Machine Learning Надзорни срещу ненадзорни

      Кога какъв модел да използвате
    Natural Language Processing (NLP)
  • Data Visualization
  • Най-добри практики Избор на правилната диаграма за правилните данни Цветови палети Преминаване на следващото ниво Табла за управление Интерактивни визуализации
  • Разказване на истории с данни
  • Обобщение и заключение
  • Изисквания

    • Общо разбиране на концепциите за бази данни
    • Основно разбиране на статистиката
     35 Hours

    Брой участници



    Цена за участник

    Oтзиви от потребители (2)

    Свързани Kурсове

    GPU Data Science with NVIDIA RAPIDS

    14 Hours

    QGIS for Geographic Information System

    21 Hours

    Свързани Kатегории