План на курса
Седмица 1 Основни концепции за Big Data
- Определение на VVVV (Velocity, Volume, Variety, Veracity)
- Ограничения на традиционната капацитет за обработка на данни
- Разпределени обработки
- Статистически анализ
- Типове машинно обучение
- Визуализация на данни
- Разпределени обработки (например, map-reduce)
- Въведение в използваните езици
- Бърз курс за езика R
- Бърз курс за Python
Седмици 2 и 3 Извършване на анализ на данни
- Статистически анализ
- Описваща статистика в големи набори данни (например, изчисляване на средна стойност)
- Изводна статистика (оценяване)
- Предсказване с модели за корелация и регресия
- Анализ на временни редове
- Основни концепции за машинно обучение
- Наблюдавано vs не наблюдавано обучение
- Класификация и кластеризация
- Оценка на разходите за специфични методи
- Филтриране
Седмица 4 Обработка на естествен език
- Обработка на текст
- Разбиране на значението на текста
- Автоматично генериране на текст
- Анализ на настроение/тема
- Компютърно зрение
Седмици 5 и 6 Концепция за инструменти
- Решения за съхранение на данни (SQL, NoSQL, йерархични, ориентирани към обекти, ориентирани към документи)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, и т.н. . .)
- Избор на правилно решение за проблема
- Разпределени обработки
- Spark
- Машинно обучение с Spark (MLLib)
- Spark SQL
- Мащабируемост
- Публично облако (AWS, Google, и т.н. . .)
- Частно облако (OpenStack, cloud foundry)
- Автоматично масштабиране
Седмица 7 Меки умения
- Консултантски и лидерски умения
- Направяне на впечатление: разказване на истории с данни
- Разбиране на публиката
- Ефективно представяне на данни - предаване на вашето съобщение
- Ефективност на влияние и лидерство на промени
- Справяне с трудни ситуации
Изпит
- Крайно оценяване на програмата
Изисквания
Участниците трябва да имат добри познания по математика, най-малко средно ниво.
Въпреки че не са необходими умения за програмиране, всякакви умения по програмиране ще бъдат полезни.
Участниците ще бъдат оценени и интервюирани преди участие в тази програма за обучение.
Отзиви от потребители (5)
Разбиране на големи данни по-добре
Shaune Dennis - Vodacom
Курс - Big Data Business Intelligence for Telecom and Communication Service Providers
Машинен превод
Обучението беше подходящо. И в действителност, много ми беше подкрепително да се запиша за курса.
Grace Goh - DBS Bank Ltd
Курс - Python in Data Science
Машинен превод
Тема представяне на знания за времето
Aly Saleh - FAB banak Egypt
Курс - Introduction to Data Science and AI (using Python)
Машинен превод
Също е страхотно да бъде курсът нареден спрямо ключовите области, които съм обозначил в предходния анкетен лист. Това е много полезно за да отговаря на въпросите, които имам по темата, и да бъде в съответствие с целите ми за обучение.
Winnie Chan - Statistics Canada
Курс - Jupyter for Data Science Teams
Машинен превод
Това показва много методи с предварително подготвени скриптове - много добре подготвени материали и лесно за проследяване
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Курс - Machine Learning – Data science
Машинен превод