Курс за обучение по Big Data Storage Solution - NoSQL
Когато традиционните технологии за съхранение не се справят с количеството данни, които трябва да съхранявате, има стотици алтернативи. Този курс се опитва да насочи участниците какви са алтернативите за съхранение и анализ Big Data и какви са техните плюсове и минуси.
Този курс е съсредоточен най-вече върху дискусия и представяне на решения, въпреки че практическите упражнения са достъпни при поискване.
План на курса
Граници на традиционните технологии
- SQL бази данни Излишък: реплики и клъстери Ограничения Скорост
Преглед на типовете бази данни
- Обектни бази данни Съхранение на документи Облачни бази данни Съхраняване на широка колона Многоизмерни бази данни Многостойностни бази данни Стрийминг и времеви серии Бази данни Мултимоделни бази данни Графични бази данни Ключова стойност XML Бази данни Разпределение на файлови системи
Популярни №SQL бази данни
- MongoDB Cassandra Apache Hadoop Apache Spark други решения
Ново SQL
- Преглед на наличните решения Несъответствия в производителността
Съхранение на документи/Search Оптимизирано
- Solr/Lucene/Elasticsearch други разтвори
Изисквания
Добро разбиране на традиционните технологии за съхранение на данни (MySQL, Oracle, SQL Server и т.н...)
Отворените курсове за обучение изискват 5+ участници.
Курс за обучение по Big Data Storage Solution - NoSQL - Booking
Курс за обучение по Big Data Storage Solution - NoSQL - Enquiry
Big Data Storage Solution - NoSQL - Консултантско запитване
Консултантско запитване
Oтзиви от потребители (5)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafal - Nordea
Курс - Apache Spark MLlib
Машинен превод
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Курс - Data Vault: Building a Scalable Data Warehouse
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Курс - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Курс - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Курс - Apache NiFi for Developers
Предстоящи Курсове
Свързани Kурсове
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 ЧасаТози курс е предназначен за разработчици и специалисти по данни, които искат да разберат и внедрят изкуствения интелект в своите приложения. Специален фокус е върху анализа на данни, разпределения изкуствен интелект и обработката на естествен език.
Unified Batch and Stream Processing with Apache Beam
14 ЧасаApache Beam е унифициран програмен модел с отворен код за дефиниране и изпълнение на паралелни канали за обработка на данни. Силата му се крие в способността му да изпълнява както партидни, така и поточни тръбопроводи, като изпълнението се извършва от един от поддържаните бек-ендове за разпределена обработка на Beam: Apache Apex, Apache Flink, Apache Spark и Google Cloud Dataflow. Apache Beam е полезен за ETL (извличане, трансформиране и зареждане) задачи като преместване на данни между различни носители за съхранение и източници на данни, трансформиране на данни в по-желан формат и зареждане на данни в нова система.
В това обучение на живо, ръководено от инструктор (на място или дистанционно), участниците ще научат как да внедрят Apache Beam SDK в Java или Python приложение, което дефинира тръбопровод за обработка на данни за разлагане на голям набор от данни на по-малки парчета за независима, паралелна обработка.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Apache Beam.
- Използвайте един модел за програмиране, за да извършите както пакетна, така и поточна обработка от тяхното Java или Python приложение.
- Изпълнете конвейери в множество среди.
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика
Забележка
- Този курс ще бъде достъпен Scala в бъдеще. Моля, свържете се с нас, за да уговорим.
NoSQL Database with Microsoft Azure Cosmos DB
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към администратори на бази данни или разработчици, които желаят да използват Microsoft Azure Cosmos DB за разработване и управление на приложения с висока реакция и ниска латентност.
До края на това обучение участниците ще могат:
- Осигурете необходимите ресурси на Cosmos DB, за да започнете изграждането на бази данни и приложения.
- Мащабирайте производителността и съхранението на приложения чрез използване на API в Cosmos DB.
- Управлявайте операциите с бази данни и намалете разходите чрез оптимизиране на ресурсите на Cosmos DB.
Data Vault: Building a Scalable Data Warehouse
28 ЧасаВ това водено от инструктор обучение на живо в България участниците ще се научат как да изградят Data Vault.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и дизайна зад Data Vault 2.0 и взаимодействието му с Big Data, NoSQL и AI.
- Използвайте техники за съхранение на данни, за да активирате одит, проследяване и проверка на исторически данни в хранилище за данни.
- Разработете последователен и повторяем ETL (извличане, трансформиране, зареждане) процес.
- Изграждайте и внедрявайте силно мащабируеми и повтарящи се складове.
Apache Flink Fundamentals
28 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) представя принципите и подходите зад обработката на разпределен поток и пакетна обработка на данни и превежда участниците през създаването на приложение за стрийминг на данни в реално време в Apache Flink.
До края на това обучение участниците ще могат:
- Настройте среда за разработване на приложения за анализ на данни.
- Разберете как работи библиотеката за обработка на графики (Gelly) на Apache Flink.
- Пакетирайте, изпълнявайте и наблюдавайте Flink-базирани, устойчиви на грешки приложения за поточно предаване на данни.
- Управлявайте различни натоварвания.
- Извършвайте разширен анализ.
- Настройте Flink клъстер с множество възли.
- Измерете и оптимизирайте производителността.
- Интегрирайте Flink с различни Big Data системи.
- Сравнете възможностите на Flink с тези на други рамки за обработка на големи данни.
Introduction to Graph Computing
28 ЧасаВ това водено от инструктор обучение на живо в България участниците ще научат за технологичните предложения и подходите за внедряване за обработка на графични данни. Целта е да се идентифицират обекти от реалния свят, техните характеристики и взаимоотношения, след това да се моделират тези взаимоотношения и да се обработят като данни с помощта на Graph Computing (известен също като Graph Analytics) подход. Започваме с широк преглед и се ограничаваме до конкретни инструменти, докато преминаваме през поредица от казуси, практически упражнения и внедрявания на живо.
До края на това обучение участниците ще могат:
- Разберете как данните от графиката се поддържат и преминават.
- Изберете най-добрата рамка за дадена задача (от бази данни с графики до рамки за пакетна обработка.)
- Приложете Hadoop, Spark, GraphX и Pregel за извършване на графични изчисления в много машини паралелно.
- Вижте реални проблеми с големи данни от гледна точка на графики, процеси и обхождания.
Hortonworks Data Platform (HDP) for Administrators
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) представя Hortonworks Data Platform (HDP) и превежда участниците през внедряването на решението Spark + Hadoop.
До края на това обучение участниците ще могат:
- Използвайте Hortonworks за надеждно изпълнение на Hadoop в голям мащаб.
- Обединете възможностите за сигурност, управление и операции на Hadoop с гъвкавите аналитични работни процеси на Spark.
- Използвайте Hortonworks, за да проучите, валидирате, сертифицирате и поддържате всеки от компонентите в проект на Spark.
- Обработвайте различни видове данни, включително структурирани, неструктурирани, в движение и в покой.
Data Analysis with Hive/HiveQL
7 ЧасаТози курс обхваща как да използвате езика Hive SQL (AKA: Hive HQL, SQL на Hive, HiveQL) за хора, които извличат данни от Hive
Impala for Business Intelligence
21 ЧасаCloudera Impala е машина за заявки за масивна паралелна обработка (MPP) SQL с отворен код за Apache Hadoop клъстери.
Impala позволява на потребителите да изпращат заявки с ниска латентност SQL към данни, съхранявани в Hadoop Distributed File System и Apache Hbase, без да се изисква движение или трансформация на данни.
Публика
Този курс е насочен към анализатори и специалисти по данни, извършващи анализ на данни, съхранявани в Hadoop чрез Business Intelligence или SQL инструменти.
След този курс делегатите ще могат
- Извлечете значима информация от Hadoop клъстери с Impala.
- Напишете специфични програми за улесняване на Business интелигентността на Impala SQL диалекта.
- Отстраняване на неизправности Impala.
Confluent KSQL
7 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици, които желаят да приложат Apache Kafka поточно обработване без писане на код.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Confluent KSQL.
- Настройте тръбопровод за обработка на потоци, като използвате само SQL команди (без Java или Python кодиране).
- Извършвайте филтриране на данни, трансформации, агрегации, обединения, прозорци и сесии изцяло в SQL.
- Проектирайте и разположете интерактивни, непрекъснати заявки за поточно предаване на ETL и анализи в реално време.
Apache NiFi for Administrators
21 ЧасаВ това водено от инструктор обучение на живо в България (на място или дистанционно), участниците ще се научат как да внедряват и управляват Apache NiFi в лабораторна среда на живо.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Apachi NiFi.
- Извличайте, трансформирайте и управлявайте данни от различни, разпределени източници на данни, включително бази данни и големи езера от данни.
- Автоматизирайте потоците от данни.
- Активиране на поточно анализиране.
- Приложете различни подходи за поглъщане на данни.
- Трансформирайте Big Data и в бизнес прозрения.
Apache NiFi for Developers
7 ЧасаВ това водено от инструктор обучение на живо в България, участниците ще научат основите на базираното на поток програмиране, докато разработват редица демонстрационни разширения, компоненти и процесори, използвайки Apache NiFi.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и потока от данни на NiFi.
- Разработвайте разширения с помощта на NiFi и API на трети страни.
- Персонализирано разработване на собствен процесор Apache Nifi.
- Поглъщайте и обработвайте данни в реално време от различни и необичайни файлови формати и източници на данни.
Python and Spark for Big Data (PySpark)
21 ЧасаВ това водено от инструктор обучение на живо в България участниците ще се научат как да използват Python и Spark заедно, за да анализират големи данни, докато работят върху практически упражнения.
До края на това обучение участниците ще могат:
- Научете как да използвате Spark с Python за анализ на Big Data.
- Работете върху упражнения, които имитират случаи от реалния свят.
- Използвайте различни инструменти и техники за анализ на големи данни, използвайки PySpark.
Spark Streaming with Python and Kafka
7 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към инженери по данни, учени по данни и програмисти, които желаят да използват Spark Streaming функции при обработка и анализ на данни в реално време.
До края на това обучение участниците ще могат да използват Spark Streaming за обработка на потоци от данни на живо за използване в бази данни, файлови системи и табла за управление на живо.
Apache Spark MLlib
35 ЧасаMLlib е библиотеката за машинно обучение (ML) на Spark. Целта му е да направи практическото машинно обучение мащабируемо и лесно. Състои се от общи алгоритми и помощни програми за обучение, включително класификация, регресия, клъстериране, съвместно филтриране, намаляване на размерността, както и примитиви за оптимизация от по-ниско ниво и приложни програмни интерфейси за конвейер от по-високо ниво.
Разделя се на два пакета:
- spark.mllib съдържа оригиналния API, изграден върху RDD. spark.ml предоставя API от по-високо ниво, изграден върху DataFrames за конструиране на ML тръбопроводи.
Публика
Този курс е насочен към инженери и разработчици, които искат да използват вградена машинна библиотека за Apache Spark