Курс за обучение по From Data to Decision with Big Data and Predictive Analytics
Публика
Ако се опитвате да разберете смисъла на данните, до които имате достъп, или искате да анализирате неструктурирани данни, налични в мрежата (като Twitter, Linked in и т.н.), този курс е за вас.
Той е насочен най-вече към вземащите решения и хората, които трябва да изберат кои данни си струва да се събират и кои да се анализират.
Не е насочен към хората, които конфигурират решението, но тези хора ще се възползват от общата картина.
Режим на доставка
По време на курса на делегатите ще бъдат представени работещи примери за предимно технологии с отворен код.
Кратки лекции ще бъдат последвани от презентации и прости упражнения от участниците
Използвано съдържание и софтуер
Целият използван софтуер се актуализира при всяко провеждане на курса, така че проверяваме възможно най-новите версии.
Той обхваща процеса от получаване, форматиране, обработка и анализ на данните, за да обясни как да автоматизирате процеса на вземане на решения с машинно обучение.
План на курса
Бърз Преглед
- Източници на данни Minding Data Recommender системи Цел Marketing
Типове данни
- Структурирани срещу неструктурирани Статични срещу поточно Данни за отношението, поведението и демографските данни Валидност на аналитични данни, управлявани от данни срещу управлявани от потребители Обем, скорост и разнообразие от данни
Модели
- Изграждане на модели Статистически модели Машинно обучение
Класификация на данните
- Групиране на kGroups, k-означава, най-близките съседи Колонии на мравки, ята на птици
Предсказуеми модели
- Дървета на решения Поддържаща векторна машина Наивна байесова класификация Невронни мрежи Модел на Марков Регресия Методи на ансамбъла
ROI
- Съотношение полза/разходи Разходи за софтуер Разходи за разработка Потенциални ползи
Строителни модели
- Подготовка на данни (MapReduce) Почистване на данни Избор на методи Разработване на модел Тестване на модел Оценка на модел Внедряване и интегриране на модел
Преглед на софтуера с отворен код и комерсиалния софтуер
- Избор на R-project пакет Python библиотеки Hadoop и Mahout Избрани Apache проекти, свързани с Big Data и Analytics Избрано търговско решение Интеграция със съществуващ софтуер и източници на данни
Изисквания
Разбиране на традиционните методи за управление и анализ на данни като SQL, складове за данни, бизнес разузнаване, OLAP и т.н... Разбиране на основни статистики и вероятности (средна стойност, дисперсия, вероятност, условна вероятност и т.н...)
Отворените курсове за обучение изискват 5+ участници.
Курс за обучение по From Data to Decision with Big Data and Predictive Analytics - Booking
Курс за обучение по From Data to Decision with Big Data and Predictive Analytics - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Консултантско запитване
Oтзиви от потребители (2)
Съдържанието, тъй като го намерих за много интересно и смятам, че ще ми помогне в последната ми година в университета.
Krishan - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Свързани Kурсове
Predictive AI in DevOps: Enhancing Software Delivery
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към професионалисти на средно ниво DevOps, които желаят да интегрират предсказуем AI в своите DevOps практики.
До края на това обучение участниците ще могат:
- Внедрете модели за предсказуем анализ, за да прогнозирате и разрешите предизвикателства в DevOps етапа.
- Използвайте управлявани от AI инструменти за подобрено наблюдение и операции.
- Прилагайте техники за машинно обучение, за да подобрите работните процеси за доставка на софтуер.
- Проектирайте AI стратегии за проактивно разрешаване на проблеми и оптимизиране.
- Навигирайте в етичните съображения за използване на AI в DevOps.
Introduction to Predictive AI
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към ИТ професионалисти на ниво начинаещи, които искат да разберат основите на Predictive AI.
До края на това обучение участниците ще могат:
- Разберете основните концепции на Predictive AI и неговите приложения.
- Събирайте, почиствайте и обработвайте предварително данни за прогнозен анализ.
- Изследвайте и визуализирайте данни, за да разкриете прозрения.
- Изградете основни статистически модели, за да правите прогнози.
- Оценете ефективността на прогнозните модели.
- Приложете концепции за предсказуем AI към сценарии от реалния свят.
Data Vault: Building a Scalable Data Warehouse
28 ЧасаВ това водено от инструктор обучение на живо в България участниците ще се научат как да изградят Data Vault.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и дизайна зад Data Vault 2.0 и взаимодействието му с Big Data, NoSQL и AI.
- Използвайте техники за съхранение на данни, за да активирате одит, проследяване и проверка на исторически данни в хранилище за данни.
- Разработете последователен и повторяем ETL (извличане, трансформиране, зареждане) процес.
- Изграждайте и разгръщайте високо мащабируеми и повтарящи се складове.
Spark Streaming with Python and Kafka
7 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към инженери по данни, учени по данни и програмисти, които желаят да използват Spark Streaming функции при обработка и анализ на данни в реално време.
До края на това обучение участниците ще могат да използват Spark Streaming за обработка на потоци от данни на живо за използване в бази данни, файлови системи и табла за управление на живо.
Confluent KSQL
7 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици, които желаят да приложат Apache Kafka поточно обработване без писане на код.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Confluent KSQL.
- Настройте тръбопровод за обработка на потоци, като използвате само SQL команди (без кодиране на Java или Python).
- Извършвайте филтриране на данни, трансформации, агрегации, обединения, прозорци и сесии изцяло в SQL.
- Проектирайте и разположете интерактивни, непрекъснати заявки за поточно предаване на ETL и анализи в реално време.
Apache Ignite for Developers
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици, които искат да научат принципите зад постоянното и чисто съхранение в паметта, докато преминават през създаването на примерен проект за изчисления в паметта.
До края на това обучение участниците ще могат:
- Използвайте Ignite за постоянство в паметта, на диска, както и за чисто разпределена база данни в паметта. Постигнете постоянство без синхронизиране на данни обратно към релационна база данни. Използвайте Ignite, за да извършите SQL и разпределени съединения. Подобрете производителността, като преместите данните по-близо до процесора, като използвате RAM като място за съхранение. Разпределете набори от данни в клъстер, за да постигнете хоризонтална мащабируемост. Интегрирайте Ignite с RDBMS, NoSQL, Hadoop и процесори за машинно обучение.
Unified Batch and Stream Processing with Apache Beam
14 ЧасаApache Beam е унифициран програмен модел с отворен код за дефиниране и изпълнение на паралелни канали за обработка на данни. Силата му се крие в способността му да изпълнява както пакетни, така и поточни тръбопроводи, като изпълнението се извършва от един от поддържаните бек-ендове за разпределена обработка на Beam: Apache Apex, Apache Flink, Apache Spark и Google Cloud Dataflow. Apache Beam е полезен за ETL (извличане, трансформиране и зареждане) задачи като преместване на данни между различни носители за съхранение и източници на данни, трансформиране на данни в по-желан формат и зареждане на данни в нова система.
В това водено от инструктор обучение на живо (на място или дистанционно) участниците ще се научат как да внедрят Apache Beam SDK в Java или Python приложение, което дефинира тръбопровод за обработка на данни за разлагане на голям набор от данни на по-малки парчета за независими, паралелна обработка.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Apache Beam. Използвайте един модел на програмиране, за да извършвате както пакетна, така и поточна обработка от тяхното Java или Python приложение. Изпълнете конвейери в множество среди.
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика
Забележка
- Този курс ще бъде достъпен Scala в бъдеще. Моля, свържете се с нас, за да уговорим.
Apache Apex: Processing Big Data-in-Motion
21 ЧасаApache Apex е платформа, базирана на YARN, която обединява поточна и пакетна обработка. Той обработва големи данни в движение по начин, който е мащабируем, производителен, устойчив на грешки, поддържащ състоянието, защитен, разпределен и лесен за работа.
Това обучение на живо, водено от инструктор, представя унифицираната архитектура за обработка на потоци на Apache Apex и превежда участниците през създаването на разпределено приложение, използващо Apex на Hadoop.
До края на това обучение участниците ще могат:
- Разберете концепциите на тръбопровода за обработка на данни, като конектори за източници и приемници, общи трансформации на данни и т.н. Изградете, мащабирайте и оптимизирайте приложение Apex Обработвайте потоци от данни в реално време надеждно и с минимално забавяне Използвайте Apex Core и библиотеката Apex Malhar, за да активирате бързо приложение разработка Използвайте Apex API за писане и повторно използване на съществуващ Java код Интегрирайте Apex в други приложения като машина за обработка Настройвайте, тествайте и мащабирайте Apex приложения
Формат на курса
- Интерактивна лекция и дискусия. Много упражнения и практика. Практическо внедряване в лабораторна среда на живо.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Apache Storm
28 ЧасаApache Storm е разпределен, реално време компютърни двигател, използван за предоставяне на бизнес интелигентност в реално време. Това се прави, като позволява на приложенията надеждно да обработват неограничени потоци от данни (напр. за обработка на потока).
"Storm е за обработка в реално време, което Hadoop е за обработка на партида!"
В това обучение, ръководено от инструктори, участниците ще научат как да инсталирате и конфигурирате Apache Storm, а след това да развиете и разпространявате Apache Storm приложение за обработка на големи данни в реално време.
Някои от темите, включени в това обучение включват:
- Apache Storm в контекста на Hadoop
- Работа с неограничени данни
- непрекъснато изчисляване
- Анализ в реално време
- Разпределена обработка на RPC и ETL
Потърсете този курс сега!
публиката
- Софтуер и ETL разработчици
- Професионалисти от Mainframe
- Данни учени
- Анализ на големите данни
- [ 0 ] Професионалисти
Формат на курса
- Разделна лекция, разделна дискусия, упражнения и тежка практика
Apache NiFi for Administrators
21 ЧасаВ това водено от инструктор обучение на живо в България (на място или дистанционно), участниците ще се научат как да внедряват и управляват Apache NiFi в лабораторна среда на живо.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Apachi NiFi.
- Извличайте, трансформирайте и управлявайте данни от различни, разпределени източници на данни, включително бази данни и големи езера от данни.
- Автоматизирайте потоците от данни.
- Активиране на поточно анализиране.
- Приложете различни подходи за поглъщане на данни.
- Трансформирайте Big Data и в бизнес прозрения.
Apache NiFi for Developers
7 ЧасаВ това водено от инструктор обучение на живо в България участниците ще научат основите на базираното на потока програмиране, докато разработват редица демонстрационни разширения, компоненти и процесори, използвайки Apache NiFi.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и потока от данни на NiFi.
- Разработвайте разширения с помощта на NiFi и API на трети страни.
- Персонализирано разработване на собствен процесор Apache Nifi.
- Поглъщайте и обработвайте данни в реално време от различни и необичайни файлови формати и източници на данни.
Apache Flink Fundamentals
28 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) представя принципите и подходите зад обработката на разпределен поток и пакетна обработка на данни и превежда участниците през създаването на приложение за стрийминг на данни в реално време в Apache Flink.
До края на това обучение участниците ще могат:
- Настройте среда за разработване на приложения за анализ на данни. Разберете как работи библиотеката за обработка на графики на Apache Flink (Gelly). Пакетирайте, изпълнявайте и наблюдавайте Flink-базирани, устойчиви на грешки приложения за поточно предаване на данни. Управлявайте различни натоварвания. Извършване на разширен анализ. Настройте Flink клъстер с множество възли. Измерете и оптимизирайте производителността. Интегрирайте Flink с различни Big Data системи. Сравнете възможностите на Flink с тези на други рамки за обработка на големи данни.
Python and Spark for Big Data (PySpark)
21 ЧасаВ това водено от инструктор обучение на живо в България участниците ще се научат как да използват Python и Spark заедно, за да анализират големи данни, докато работят върху практически упражнения.
До края на това обучение участниците ще могат:
- Научете как да използвате Spark с Python за анализ на големи данни.
- Работете върху упражнения, които имитират случаи от реалния свят.
- Използвайте различни инструменти и техники за анализ на големи данни с помощта на PySpark.
Introduction to Graph Computing
28 ЧасаВ това водено от инструктор обучение на живо в България участниците ще научат за технологичните предложения и подходите за внедряване за обработка на графични данни. Целта е да се идентифицират обекти от реалния свят, техните характеристики и връзки, след това да се моделират тези връзки и да се обработват като данни с помощта на Graph Computing (известен също като Graph Analytics) подход. Започваме с широк преглед и се ограничаваме до конкретни инструменти, докато преминаваме през поредица от казуси, практически упражнения и внедрявания на живо.
До края на това обучение участниците ще могат:
- Разберете как данните от графиката се поддържат и преминават.
- Изберете най-добрата рамка за дадена задача (от бази данни с графики до рамки за групова обработка.)
- Приложете Hadoop, Spark, GraphX и Pregel за извършване на изчисления на графики в много машини паралелно.
- Вижте реални проблеми с големи данни от гледна точка на графики, процеси и обхождания.
Apache Spark MLlib
35 ЧасаMLlib е библиотеката за машинно обучение (ML) на Spark. Целта му е да направи практическото машинно обучение мащабируемо и лесно. Състои се от общи алгоритми и помощни програми за обучение, включително класификация, регресия, клъстериране, съвместно филтриране, намаляване на размерността, както и примитиви за оптимизация от по-ниско ниво и приложни програмни интерфейси за конвейер от по-високо ниво.
Разделя се на два пакета:
- spark.mllib съдържа оригиналния API, изграден върху RDD. spark.ml предоставя API от по-високо ниво, изграден върху DataFrames за конструиране на ML тръбопроводи.
Публика
Този курс е насочен към инженери и разработчици, които искат да използват вградена машинна библиотека за Apache Spark