План на курса
Седмица 1 Big Data концепции
- Дефиниция на VVVV (скорост, обем, разнообразие, достоверност) Ограничения на традиционния капацитет за обработка на данни Разпределена обработка Статистически анализ Машинно обучение Видове анализи Визуализация на данни Разпределена обработка (напр. map-reduce) Въведение в използваните езици Интензивен курс на R език Python интензивен курс
Седмици 2 и 3 Изпълнение Data Analysis
- Статистически анализ Описателен Statistics в набори от големи данни (напр. изчисляване на средна стойност) Инференциален Statistics (оценка) Прогнозиране с модели на корелация и регресия Анализ на времеви редове Основи на машинното обучение Учене под надзор срещу неконтролирано обучение Класификация и клъстериране Оценка на разходите за специфични методи Филтър
Седмица 4 Обработка на естествен език
- Обработка на текст Разбиране на смисъла на текста Автоматично генериране на текст Анализ на настроение/тема Computer Vision
Седмица 5 и 6 Концепция за инструменти
- Решение за съхранение на данни (SQL, NoSQL, йерархично, обектно ориентирано, ориентирано към документи) MySQL, Cassandra, MongoDB, Elasticsearch, HDFS и др...) Избор на правилното решение на проблема Разпределена обработка Spark Machine Learning с Spark (MLLib) Spark SQL Мащабируемост Публичен облак (AWS, Google и т.н...) Частен облак (OpenStack, облачна леярна) Автоматично мащабируемост
Седмица 7 Soft Skills
- Консултантски и Leadership умения Оказване на въздействие: разказване на истории, основано на данни Разбиране на вашата аудитория Ефективно представяне на данни – предаване на вашето послание Ефективност на влиянието и промяна на лидерството Справяне с трудни ситуации
Изпит
- Краен изпит по програмата
Изисквания
Участниците трябва да имат добри познания по математика, най-малко средно ниво.
Въпреки че не са необходими умения за програмиране, всякакви умения по програмиране ще бъдат полезни.
Участниците ще бъдат оценени и интервюирани преди участие в тази програма за обучение.
Oтзиви от потребители (5)
Разбиране на големи данни по-добре
Shaune Dennis - Vodacom
Курс - Big Data Business Intelligence for Telecom and Communication Service Providers
Машинен превод
Обучението беше подходящо. И в действителност, много ми беше подкрепително да се запиша за курса.
Grace Goh - DBS Bank Ltd
Курс - Python in Data Science
Машинен превод
Тема представяне на знания за времето
Aly Saleh - FAB banak Egypt
Курс - Introduction to Data Science and AI (using Python)
Машинен превод
Също е страхотно да бъде курсът нареден спрямо ключовите области, които съм обозначил в предходния анкетен лист. Това е много полезно за да отговаря на въпросите, които имам по темата, и да бъде в съответствие с целите ми за обучение.
Winnie Chan - Statistics Canada
Курс - Jupyter for Data Science Teams
Машинен превод
Това показва много методи с предварително подготвени скриптове - много добре подготвени материали и лесно за проследяване
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Курс - Machine Learning – Data science
Машинен превод