Unified Batch and Stream Processing with Apache Beam Training Course

Apache Beam е унифициран програмен модел с отворен код за дефиниране и изпълнение на паралелни канали за обработка на данни. Силата му се крие в способността му да изпълнява както пакетни, така и поточни тръбопроводи, като изпълнението се извършва от един от поддържаните бек-ендове за разпределена обработка на Beam: Apache Apex, Apache Flink, Apache Spark и Google Cloud Dataflow. Apache Beam е полезен за ETL (извличане, трансформиране и зареждане) задачи като преместване на данни между различни носители за съхранение и източници на данни, трансформиране на данни в по-желан формат и зареждане на данни в нова система.

В това водено от инструктор обучение на живо (на място или дистанционно) участниците ще се научат как да внедрят Apache Beam SDK в Java или Python приложение, което дефинира тръбопровод за обработка на данни за разлагане на голям набор от данни на по-малки парчета за независими, паралелна обработка.

До края на това обучение участниците ще могат:

Инсталирайте и конфигурирайте Apache Beam. Използвайте един модел на програмиране, за да извършвате както пакетна, така и поточна обработка от тяхното Java или Python приложение. Изпълнете конвейери в множество среди.

Формат на курса

Част лекция, част дискусия, упражнения и тежка практическа практика

Забележка

Този курс ще бъде достъпен Scala в бъдеще. Моля, свържете се с нас, за да уговорим.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Oтзиви от потребители (1)

Sufficient hands on, trainer is knowledgable

Chris Tan

Course - A Practical Introduction to Stream Processing

Свързани Kурсове

Building Kafka Solutions with Confluent

14 Hours

A Practical Introduction to Stream Processing

21 Hours

Apache Kafka for Python Programmers

7 Hours

Stream Processing with Kafka Streams

7 Hours

Samza for Stream Processing

14 Hours

Apache Flink Fundamentals

28 Hours

Apache NiFi for Administrators

21 Hours

Apache NiFi for Developers

7 Hours

Apache Storm

28 Hours

Apache Apex: Processing Big Data-in-Motion

21 Hours

Apache Apex е платформа, базирана на YARN, която обединява поточна и пакетна обработка. Той обработва големи данни в движение по начин, който е мащабируем, производителен, устойчив на грешки, поддържащ състоянието, защитен, разпределен и лесен за работа.

Това обучение на живо, водено от инструктор, представя унифицираната архитектура за обработка на потоци на Apache Apex и превежда участниците през създаването на разпределено приложение, използващо Apex на Hadoop.

До края на това обучение участниците ще могат:

Разберете концепциите на тръбопровода за обработка на данни, като конектори за източници и приемници, общи трансформации на данни и т.н. Изградете, мащабирайте и оптимизирайте приложение Apex Обработвайте потоци от данни в реално време надеждно и с минимално забавяне Използвайте Apex Core и библиотеката Apex Malhar, за да активирате бързо приложение разработка Използвайте Apex API за писане и повторно използване на съществуващ Java код Интегрирайте Apex в други приложения като машина за обработка Настройвайте, тествайте и мащабирайте Apex приложения

Формат на курса

Интерактивна лекция и дискусия. Много упражнения и практика. Практическо внедряване в лабораторна среда на живо.

Опции за персонализиране на курса

За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.

Прочети повече...