План на курса

Бърз Преглед

    Източници на данни Minding Data Recommender системи Цел Marketing

Типове данни

    Структурирани срещу неструктурирани Статични срещу поточно Данни за отношението, поведението и демографските данни Валидност на аналитични данни, управлявани от данни срещу управлявани от потребители Обем, скорост и разнообразие от данни

Модели

    Изграждане на модели Статистически модели Машинно обучение

Класификация на данните

    Групиране на kGroups, k-означава, най-близките съседи Колонии на мравки, ята на птици

Предсказуеми модели

    Дървета на решения Поддържаща векторна машина Наивна байесова класификация Невронни мрежи Модел на Марков Регресия Методи на ансамбъла

ROI

    Съотношение полза/разходи Разходи за софтуер Разходи за разработка Потенциални ползи

Строителни модели

    Подготовка на данни (MapReduce) Почистване на данни Избор на методи Разработване на модел Тестване на модел Оценка на модел Внедряване и интегриране на модел

Преглед на софтуера с отворен код и комерсиалния софтуер

    Избор на R-project пакет Python библиотеки Hadoop и Mahout Избрани Apache проекти, свързани с Big Data и Analytics Избрано търговско решение Интеграция със съществуващ софтуер и източници на данни

Изисквания

Разбиране на традиционните методи за управление и анализ на данни като SQL, складове за данни, бизнес разузнаване, OLAP и т.н... Разбиране на основни статистики и вероятности (средна стойност, дисперсия, вероятност, условна вероятност и т.н...)

 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (1)

Свързани Kатегории