Курс за обучение по Data Mining and Analysis
Обективен:
Делегатите могат да анализират големи набори от данни, да извличат модели, да избират правилната променлива, влияеща върху резултатите, така че да се прогнозира нов модел с прогнозни резултати.
План на курса
Предварителна обработка на данни
- Data Cleaning
- Интеграция и трансформация на данни
- Намаляване на данните
- Дискретизация и генериране на концептуална йерархия
Статистически извод
- Вероятностни разпределения, Случайни променливи, Централна гранична теорема
- Вземане на проби
- Доверителни интервали
- Статистически извод
- Проверка на хипотези
Многомерна линейна регресия
- Спецификация
- Избор на подмножество
- Оценка
- Валидиране
- Прогноза
Методи за класификация
- Логистична регресия
- Линеен дискриминантен анализ
- K-най-близки съседи
- Наивен Бейс
- Сравнение на методите за класификация
Neural Networks
- Напасване на невронни мрежи
- Проблеми с обучението на невронни мрежи
Дървета на решенията
- Регресионни дървета
- Класификационни дървета
- Дървета срещу линейни модели
Пакетиране, Random Forests, Подсилване
- Пакетиране
- Random Forests
- Подсилване
Поддръжка на векторни машини и гъвкав диск
- Класификатор за максимален марж
- Поддържайте векторни класификатори
- Поддържащи векторни машини
- 2 и повече класа SVM
- Връзка с логистичната регресия
Анализ на основните компоненти
Клъстеризиране
- K-означава групиране
- Групиране на K-medoids
- Йерархично групиране
- Групиране на базата на плътност
Оценка и избор на модел
- Отклонение, дисперсия и сложност на модела
- Грешка при прогнозиране в извадката
- Байесовият подход
- Кръстосано валидиране
- Bootstrap методи
Отворените курсове за обучение изискват 5+ участници.
Курс за обучение по Data Mining and Analysis - Booking
Курс за обучение по Data Mining and Analysis - Enquiry
Data Mining and Analysis - Консултантско запитване
Консултантско запитване
Oтзиви от потребители (5)
Бях ползвал от наставления и споделяне на лични примеры + отговоряне на всички въпроси.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Курс - Data Mining and Analysis
Машинен превод
Значително се радвам на най-доброто.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Курс - Data Mining and Analysis
Машинен превод
The information given was interesting and the best part was towards the end when we were provided with Data from Durex and worked on Data we are familiar with and perform operations to get results.
Jessica Chaar
Курс - Data Mining and Analysis
Машинен превод
The hands-on exercise and the trainer capacity to explain complex topics in simple terms.
youssef chamoun
Курс - Data Mining and Analysis
Машинен превод
I like the exercises done.
Nour Assaf
Курс - Data Mining and Analysis
Машинен превод
Предстоящи Курсове
Свързани Kурсове
Programming with Big Data in R
21 ЧасаBig Data е термин, който се отнася до решения, предназначени за съхранение и обработка на големи набори от данни. Първоначално разработени от Google, тези решения за големи данни се развиха и вдъхновиха други подобни проекти, много от които са достъпни като отворен код. R е популярен език за програмиране във финансовата индустрия.
R Fundamentals
21 ЧасаR е безплатен език за програмиране с отворен код за статистически изчисления, анализ на данни и графики. R се използва от нарастващ брой мениджъри и анализатори на данни в корпорации и академични среди. R също намери последователи сред статистици, инженери и учени без умения за компютърно програмиране, които го намират за лесен за използване. Популярността му се дължи на нарастващото използване на извличане на данни за различни цели като определяне на рекламни цени, по-бързо намиране на нови лекарства или фина настройка на финансовите модели. R има голямо разнообразие от пакети за извличане на данни.
Data Mining with R
14 ЧасаR е безплатен език за програмиране с отворен код за статистически изчисления, анализ на данни и графики. R се използва от нарастващ брой мениджъри и анализатори на данни в корпорации и академични среди. R има голямо разнообразие от пакети за извличане на данни.
Econometrics: Eviews and Risk Simulator
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към всеки, който желае да научи и овладее основите на иконометричния анализ и моделиране.
До края на това обучение участниците ще могат:
- Научете и разберете основите на иконометрията.
- Използвайте Eviews и симулатори на риск.
Forecasting with R
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към анализатори на данни на средно ниво и бизнес професионалисти, които желаят да извършват прогнозиране на времеви редове и да автоматизират работните процеси за анализ на данни с помощта на R.
До края на това обучение участниците ще могат:
- Разберете основите на техниките за прогнозиране в R.
- Приложете експоненциално изглаждане и ARIMA модели за анализ на времеви редове.
- Използвайте пакета „прогноза“, за да генерирате точни модели за прогнозиране.
- Автоматизирайте работните процеси за прогнозиране за бизнес и изследователски приложения.
HR Analytics for Public Organisations
14 ЧасаТова водено от инструктор обучение на живо (онлайн или на място) е насочено към специалисти по човешки ресурси, които желаят да използват аналитични методи за подобряване на организационната ефективност. Този курс обхваща качествени, както и количествени, емпирични и статистически подходи.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практика.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Marketing Analytics using R
21 ЧасаПублика
Business собственици (маркетинг мениджъри, продуктови мениджъри, мениджъри на база клиенти) и техните екипи; професионалисти в прозренията на клиентите.
Преглед
Курсът следва жизнения цикъл на клиента от придобиването на нови клиенти, управлението на съществуващите клиенти за рентабилност, задържането на добри клиенти и накрая разбирането кои клиенти ни напускат и защо. Ще работим с реални (ако са анонимни) данни от различни индустрии, включително телекомуникации, застраховане, медии и високи технологии.
формат
Водено от инструктор обучение в рамките на пет полудневни сесии с упражнения в клас, както и домашна работа. Може да се проведе като класна стая или дистанционен (онлайн) курс.
R for Data Analysis and Research
7 ЧасаПублика
- мениджъри разработчици учени студенти
Формат на курса
онлайн инструкции и дискусии ИЛИ семинари лице в лице
Introduction to R
21 ЧасаR е свободен език за програмиране с отворен код за статистически компютри, анализ на данни и графики. Изследванията се използват от нарастващ брой мениджъри и аналитици на данни в корпорациите и академиите. R също така е намерил последователи сред статистиците, инженерите и учените без умения за компютърно програмиране, които го намират лесен за използване. Нейната популярност се дължи на нарастващото използване на данните за различни цели като определяне на рекламни цени, намиране на нови лекарства по-бързо или фини финансови модели. R има широк спектър от пакети за извличане на данни.
Този курс обхваща манипулацията на обекти в R включително данни за четене, достъп до R пакети, писане на R функции и създаване на информативни графики. Той включва анализ на данни с помощта на общи статистически модели. Курсът учи как да се използва софтуерът R (https://www.r-project.org) както на командна линия, така и в графичен потребителски интерфейс (GUI).
R
21 ЧасаR е безплатен език за програмиране с отворен код за статистически изчисления, анализ на данни и графики. R се използва от нарастващ брой мениджъри и анализатори на данни в корпорации и академични среди. R също намери последователи сред статистици, инженери и учени без умения за компютърно програмиране, които го намират за лесен за използване. Популярността му се дължи на нарастващото използване на извличане на данни за различни цели като определяне на рекламни цени, по-бързо намиране на нови лекарства или фина настройка на финансовите модели. R има голямо разнообразие от пакети за извличане на данни.
Neural Network in R
14 ЧасаТози курс е въведение в прилагането на невронни мрежи в реални проблеми с помощта на софтуер R-project.
Advanced R Programming
7 ЧасаТози курс е за специалисти по данни и статистици, които вече имат основни R & C++ умения за кодиране и R код и се нуждаят от разширени умения за R кодиране.
Целта е да се даде практически напреднал курс по R програмиране на участниците, които се интересуват от прилагането на методите на работа.
Използват се специфични за сектора примери, за да се направи обучението подходящо за аудиторията
Statistical Analysis using SPSS
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към професионалисти от начинаещи до средно ниво, които желаят да извършват статистически анализи с помощта на SPSS, за да интерпретират данните точно, да изпълняват сложни статистически тестове и да генерират значими прозрения.
До края на това обучение участниците ще могат:
- Навигирайте в интерфейса на SPSS и управлявайте ефективно масивите от данни.
- Извършвайте описателни и инференциални статистически анализи.
- Провеждане на t-тестове, ANOVA, MANOVA, регресионни и корелационни анализи.
- Прилагайте непараметрични тестове, анализ на главните компоненти и факторен анализ за разширена интерпретация на данни.
Talent Acquisition Analytics
14 ЧасаТова водено от инструктор обучение на живо (онлайн или на място) е насочено към специалисти по човешки ресурси и специалисти по набиране на персонал, които желаят да използват аналитични методи за подобряване на организационната ефективност. Този курс обхваща качествени, както и количествени, емпирични и статистически подходи.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практика.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Introduction to Data Visualization with Tidyverse and R
7 ЧасаTidyverse е колекция от многофункционални R пакети за почистване, обработка, моделиране и визуализиране на данни. Някои от включените пакети са: ggplot2, dplyr, tidyr, readr, purrr и tibble.
В това водено от инструктор обучение на живо участниците ще се научат как да манипулират и визуализират данни с помощта на инструментите, включени в Tidyverse.
До края на това обучение участниците ще могат:
- Извършвайте анализ на данни и създавайте привлекателни визуализации Направете полезни заключения от различни набори от примерни данни Филтрирайте, сортирайте и обобщете данни, за да отговорите на проучвателни въпроси Превърнете обработените данни в информативни линейни диаграми, лентови диаграми, хистограми Импортирайте и филтрирайте данни от различни източници на данни, включително [0 ], CSV и SPSS файлове
Публика
- Начинаещи в езика R. Начинаещи в анализа на данни и визуализацията на данни
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика