Курс за обучение по Apache Iceberg Fundamentals
Apache Iceberg е табличен формат с отворен код за мащабни набори от данни, който носи надеждността и простотата на SQL таблици към големи данни. Той е проектиран да решава предизвикателствата на управлението на големи данни в езера от данни, които често включват работа със сложни схеми, големи файлове и различни източници на данни.
Това водено от инструктор обучение на живо (онлайн или на място) е насочено към начинаещи професионалисти в областта на данните, които желаят да придобият знанията и уменията, необходими за ефективното използване на Apache Iceberg за управление на мащабни набори от данни, гарантиране на целостта на данните и оптимизиране на работните процеси за обработка на данни .
До края на това обучение участниците ще могат:
- Получете задълбочено разбиране на архитектурата, функциите и предимствата на Apache Iceberg.
- Научете за форматите на таблици, разделянето, еволюцията на схемата и възможностите за пътуване във времето.
- Инсталирайте и конфигурирайте Apache Iceberg в различни среди.
- Създавайте, управлявайте и манипулирайте таблици Iceberg.
- Разберете процеса на мигриране на данни от други таблични формати към Iceberg.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практика.
- Практическо внедряване в лабораторна среда на живо.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
План на курса
Въведение в Apache Iceberg
- Преглед на Apache Iceberg
- Значение и случаи на използване в съвременната архитектура на данни
- Основни характеристики и предимства
Основни концепции
- Формат и архитектура на таблицата Iceberg
- Сравнение с други формати на таблици
- Разделяне и развитие на схемата
- Пътуване във времето и версии на данни
Настройване на Apache Iceberg
- Монтаж и конфигурация
- Интегриране на Iceberg с различни машини за обработка на данни
- Настройване на среда Iceberg на локална машина
Основни операции
- Създаване и управление на таблици Iceberg
- Писане и четене от таблици Iceberg
- Основни CRUD операции
Миграция и интеграция на данни
- Мигриране на данни от Hive и други системи към Iceberg
- Интеграция с BI инструменти
- Мигриране на примерен набор от данни към Iceberg
Оптимизиране на производителността
- Техники за настройка на производителността
- Оптимизиране на заявки и сканиране на данни
- Оптимизиране на производителността в Iceberg
Преглед на разширените функции
- Еволюция на дяловете и скритото разделяне
- Еволюция на таблицата и промени в схемата
- Функции за пътуване във времето и връщане назад
- Внедряване на разширени функции в Iceberg
Обобщение и следващи стъпки
Изисквания
- Запознаване с понятия като таблици, схеми, дялове и поглъщане на данни
- Основни познания по SQL
Публика
- Инженери по данни
- Архитекти на данни
- Анализатори на данни
- Разработчици на софтуер
Отворените курсове за обучение изискват 5+ участници.
Курс за обучение по Apache Iceberg Fundamentals - Booking
Курс за обучение по Apache Iceberg Fundamentals - Enquiry
Apache Iceberg Fundamentals - Консултантско запитване
Консултантско запитване
Oтзиви от потребители (3)
Обучителят имаше добро разбиране на концепциите
Josheel - Verizon Connect
Курс - Amazon Redshift
Машинен превод
analytical functions
khusboo dassani - Tech Northwest Skillnet
Курс - SQL Advanced
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Курс - Data Vault: Building a Scalable Data Warehouse
Предстоящи Курсове
Свързани Kурсове
SQL Advanced
14 ЧасаThis instructor-led, live training in България (online or onsite) is aimed at intermediate-level database administrators, developers, and analysts who wish to master advanced SQL functionalities for complex data operations and database management.
By the end of this training, participants will be able to:
- Perform advanced querying techniques using unions, subqueries, and complex joins.
- Add, update, and delete data, tables, views, and indexes with precision.
- Ensure data integrity through transactions and manipulate database structures.
- Create and manage databases efficiently for robust data storage and retrieval.
Amazon Redshift
21 ЧасаAmazon Redshift е петабайтова услуга за съхранение на данни в облак в AWS.
В това водено от инструктор обучение на живо участниците ще научат основите на Amazon Redshift.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Amazon Redshift
- Заредете, конфигурирайте, разположете, заявете и визуализирайте данни с Amazon Redshift
Публика
- Разработчици
- ИТ специалисти
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика
Забележка
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Advanced Apache Iceberg
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към професионалисти в областта на данните на напреднало ниво, които желаят да оптимизират работните потоци за обработка на данни, да гарантират целостта на данните и да внедрят стабилни решения за съхранение на данни, които могат да се справят със сложността на съвременните големи приложения за данни.
До края на това обучение участниците ще могат:
- Получете задълбочено разбиране на архитектурата на Iceberg, включително управление на метаданни и оформление на файлове.
- Конфигурирайте Iceberg за оптимална производителност в различни среди и го интегрирайте с множество машини за обработка на данни.
- Управлявайте широкомащабни таблици Iceberg, извършвайте сложни промени в схемата и управлявайте еволюцията на дялове.
- Овладейте техники за оптимизиране на производителността на заявките и ефективността на сканиране на данни за големи набори от данни.
- Внедрете механизми за осигуряване на съгласуваност на данните, управление на транзакционни гаранции и справяне с повреди в разпределени среди.
Big Data Consulting
21 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към ИТ професионалисти на средно ниво, които желаят да подобрят уменията си в архитектурата на данни, управлението, облачните изчисления и технологиите за големи данни, за да управляват и анализират ефективно големи масиви от данни за миграция на данни в техните организации.
До края на това обучение участниците ще могат:
- Разберете основните концепции и компоненти на различни архитектури на данни.
- Получете цялостно разбиране на принципите за управление на данните и тяхното значение в регулаторната среда.
- Внедряване и управление на рамки за управление на данни като Dama и Togaf.
- Използвайте облачни платформи за ефективно съхранение, обработка и управление на данни.
Big Data & Database Systems Fundamentals
14 ЧасаКурсът е част от набора от умения за Data Scientist (Домейн: Данни и технологии).
Azure Data Lake Storage Gen2
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към инженери по данни на средно ниво, които искат да се научат как да използват Azure Data Lake Storage Gen2 за ефективни решения за анализ на данни.
До края на това обучение участниците ще могат:
- Разберете архитектурата и ключовите характеристики на Azure Data Lake Storage Gen2.
- Оптимизирайте съхранението на данни и достъпа за цена и производителност.
- Интегрирайте Azure Data Lake Storage Gen2 с други Azure услуги за анализ и обработка на данни.
- Разработване на решения с помощта на Azure Data Lake Storage Gen2 API.
- Отстранете често срещани проблеми и оптимизирайте стратегиите за съхранение.
Data Vault: Building a Scalable Data Warehouse
28 ЧасаВ това водено от инструктор обучение на живо в България участниците ще се научат как да изградят Data Vault.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и дизайна зад Data Vault 2.0 и взаимодействието му с Big Data, NoSQL и AI.
- Използвайте техники за съхранение на данни, за да активирате одит, проследяване и проверка на исторически данни в хранилище за данни.
- Разработете последователен и повторяем ETL (извличане, трансформиране, зареждане) процес.
- Изграждайте и внедрявайте силно мащабируеми и повтарящи се складове.
Apache Druid for Real-Time Data Analysis
21 ЧасаApache Druid е разпределено хранилище за данни с отворен код, ориентирано към колони, написано на Java. Той е проектиран да поглъща бързо огромни количества данни за събития и да изпълнява OLAP заявки с ниска латентност върху тези данни. Druid обикновено се използва в приложения за бизнес разузнаване за анализиране на големи обеми данни в реално време и исторически данни. Също така е много подходящ за захранване на бързи, интерактивни, аналитични табла за управление за крайни потребители. Druid се използва от компании като Alibaba, Airbnb, Cisco, eBay, Netflix, Paypal и Yahoo.
В този курс на живо, ръководен от инструктори, ние изследваме някои от ограниченията на решенията за съхранение на данни и обсъждаме как Druid може да допълни тези технологии, за да формира гъвкав и мащабируем стек за поточно анализиране. Разглеждаме много примери, предлагайки на участниците шанса да внедрят и тестват базирани на Druid решения в лабораторна среда.
Формат на курса
- Частична лекция, частична дискусия, тежка практическа практика, случайни тестове за измерване на разбирането
Greenplum Database
14 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към администратори, които желаят да настроят Greenplum Database решения за бизнес разузнаване и съхранение на данни.
До края на това обучение участниците ще могат:
- Адресирайте нуждите от обработка с Greenplum.
- Извършване на ETL операции за обработка на данни.
- Използвайте съществуващите инфраструктури за обработка на заявки.
IBM Datastage For Administrators and Developers
35 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към ИТ специалисти на средно ниво, които желаят да имат цялостно разбиране на IBM DataStage както от административна, така и от гледна точка на разработка, което им позволява да управляват и използват това инструмент ефективно на съответните им работни места.
До края на това обучение участниците ще могат:
- Разберете основните концепции на DataStage.
- Научете как ефективно да инсталирате, конфигурирате и управлявате DataStage среди.
- Свържете се с различни източници на данни и извличайте данни ефективно от бази данни, плоски файлове и външни източници.
- Приложете ефективни техники за зареждане на данни.
Apache Kylin: Real-Time OLAP on Big Data
14 ЧасаТова обучително занятие с инструктор, което се провежда на живо в България (онлайн или на място), е предназначено за професионалисти в областта на големите данни с среден ниво, които искат да използват Apache Kylin за изграждане на реално време на сгради за данни и извършване на многомерен анализ на големи масиви от данни.
До края на това обучение участниците ще могат да:
- Настроят и конфигурират Apache Kylin с източници на данни за реално време.
- Проектирайте и изграждайте OLAP кубове за както пакетни, така и потокови данни.
- Извършвайте сложни запитвания с латентност от субсекунди, използвайки интерфейса SQL на Kylin.
- Интегрирайте Kylin с инструменти за бизнес интелигентност за интерактивна визуализация на данни.
- Оптимизирайте производителността и управлявайте ресурсите ефективно в Kylin.
Oracle SQL for Development and Database Management
35 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към професионалисти в бази данни на средно ниво, които искат да подобрят уменията си в Oracle SQL разработка и администриране.
До края на това обучение участниците ще могат:
- Изградете и оптимизирайте сложни SQL заявки.
- Управлявайте ефективно бази данни с помощта на Oracle SQL инструменти.
- Прилагайте най-добрите практики в разработването и поддръжката на бази данни.
- Администриране на потребителски достъп и сигурност на базата данни в Oracle среда.