Курс за обучение по Напредна Apache Iceberg
Apache Iceberg е табличен формат с отворен код за мащабни набори от данни, който носи надеждността и простотата на SQL таблици към големи данни. Той е проектиран да решава предизвикателствата на управлението на големи данни в езера от данни, които често включват работа със сложни схеми, големи файлове и различни източници на данни.
Това водено от инструктор обучение на живо (онлайн или на място) е насочено към професионалисти в областта на данните на напреднало ниво, които желаят да оптимизират работните потоци за обработка на данни, да осигурят целостта на данните и да внедрят стабилни решения за съхранение на данни, които могат да се справят със сложността на съвременните приложения за големи данни.
До края на това обучение участниците ще могат:
- Получете задълбочено разбиране на архитектурата на Iceberg, включително управление на метаданни и оформление на файлове.
- Конфигурирайте Iceberg за оптимална производителност в различни среди и го интегрирайте с множество машини за обработка на данни.
- Управлявайте широкомащабни таблици Iceberg, извършвайте сложни промени в схемата и управлявайте еволюцията на дялове.
- Овладейте техники за оптимизиране на производителността на заявките и ефективността на сканиране на данни за големи набори от данни.
- Внедрете механизми за осигуряване на съгласуваност на данните, управление на транзакционни гаранции и справяне с повреди в разпределени среди.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практика.
- Практическо внедряване в лабораторна среда на живо.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
План на курса
Въведение в Apache Iceberg
- Преглед на Apache Iceberg
- Преглед на основните понятия
Гмурнете се дълбоко в архитектурата на айсберга
- Задълбочен анализ на формата на таблицата на Iceberg
- Подробен преглед на архитектурата, включително метаданни и файлово оформление
- Вътрешни елементи на еволюцията на схемата и дяла
Разширено инсталиране и конфигуриране
- Конфигуриране на Iceberg за оптимална производителност в различни среди
- Интеграция с различни машини за обработка на данни
- Разширена настройка: сигурност, криптиране и контрол на достъпа
- Настройване на Iceberg в разпределена среда
Разширено обслужване и поддръжка
- Управление на големи маси Iceberg
- Внедряване и управление на сложни промени в схемата
- Обработка на еволюцията на дялове и скрито разделяне
- Разширени CRUD операции с промени в схемата и дяла
Техники за оптимизиране на заявки
- Техники за намаляване на забавянето на заявката
- Подрязване на дялове и подрязване на файлове
- Кеширане на метаданни и стратегии за оптимизация
- Внедряване и тестване на техники за оптимизиране на заявки
Настройка на производителността за големи набори от данни
- Оптимизиране на производителността за масиви от данни в голям мащаб
- Използване на вградените функции на Iceberg за настройка на производителността
- Казуси за настройка на производителността в сценарии от реалния свят
- Настройка на производителността за масиви от данни в голям мащаб
Разширено мигриране и интегриране на данни
- Мигриране на сложни структури от данни от други системи
- Интегриране на Iceberg с потоци от данни в реално време
- Мигриране на сложни набори от данни и интегриране на потоци от данни в реално време
Надеждност и последователност
- Осигуряване на последователност и цялост на данните в разпределени среди
- Внедряване и управление на транзакционни гаранции
- Справяне с повреди и механизми за възстановяване
- Внедряване на функции за надеждност и последователност
Разширени функции и персонализиране
- Реализации на потребителски каталог
- Разширяване на Iceberg с персонализирани функции
- Внедряване на персонализиран каталог и разширяване на функционалностите на Iceberg
Управление на данните Go и съответствие
- Прилагане на политики за управление на данни
- Съответствие с разпоредбите за данни
- Управление на одитни пътеки и данни
- Внедряване на функции за управление и съответствие
Обобщение и следващи стъпки
Изисквания
- Запознаване с основните концепции, основните операции и управлението на таблицата Iceberg
Публика
- Инженери по данни
- Архитекти на данни
- Анализатори на данни
- Разработчици на софтуер
Отворените курсове за обучение изискват 5+ участника.
Курс за обучение по Напредна Apache Iceberg - Booking
Курс за обучение по Напредна Apache Iceberg - Enquiry
Напредна Apache Iceberg - Консултантско запитване
Консултантско запитване
Отзиви от потребители (3)
Обучителят имаше добро разбиране на концепциите
Josheel - Verizon Connect
Курс - Amazon Redshift
Машинен превод
аналитични функции
khusboo dassani - Tech Northwest Skillnet
Курс - SQL Advanced
Машинен превод
как треньорът показва своето знание по предмета, който преподава
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Курс - Data Vault: Building a Scalable Data Warehouse
Машинен превод
Предстоящи Курсове
Свързани Kурсове
Напредна
14 часаТова обучение, провеждано от инструктор, в България (онлайн или на място) е насочено към базови администратори, разработчици и аналитици с интермедиен ниво, които желаят да овладеят напреднали SQL функции за сложни операции с данни и управление на бази данни.
Към края на това обучение участниците ще могат да:
- Извършват напреднали техники за запитване с използване на съюзи, подзапитвания и сложни съединения.
- Добавят, актуализират и изтриват данни, таблици, прегледа, и индекси с точност.
- Осигуряват цялостност на данните чрез транзакции и манипулират структури на бази данни.
- Създават и управляват бази данни ефективно за надежден запис и извличане на данни.
Amazon Redshift
21 часаAmazon Redshift е петабайтова услуга за съхранение на данни в облак в AWS.
В това водено от инструктор обучение на живо участниците ще научат основите на Amazon Redshift.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Amazon Redshift
- Заредете, конфигурирайте, разположете, заявете и визуализирайте данни с Amazon Redshift
Публика
- Разработчици
- ИТ специалисти
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика
Забележка
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Apache Iceberg Fundamentals
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към начинаещи професионалисти в областта на данните, които желаят да придобият знанията и уменията, необходими за ефективно използване на Apache Iceberg за управление на мащабни набори от данни, гарантиране на целостта на данните и оптимизиране на работните процеси за обработка на данни.
До края на това обучение участниците ще могат:
- Получете задълбочено разбиране на архитектурата, функциите и предимствата на Apache Iceberg.
- Научете за форматите на таблици, разделянето, еволюцията на схемата и възможностите за пътуване във времето.
- Инсталирайте и конфигурирайте Apache Iceberg в различни среди.
- Създавайте, управлявайте и манипулирайте таблици Iceberg.
- Разберете процеса на мигриране на данни от други таблични формати към Iceberg.
Big Data Консултинг
21 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към ИТ професионалисти на средно ниво, които желаят да подобрят уменията си в архитектурата на данни, управлението, облачните изчисления и технологиите за големи данни, за да управляват и анализират ефективно големи масиви от данни за миграция на данни в техните организации.
До края на това обучение участниците ще могат:
- Разберете основните концепции и компоненти на различни архитектури на данни.
- Получете цялостно разбиране на принципите за управление на данните и тяхното значение в регулаторната среда.
- Внедряване и управление на рамки за управление на данни като Dama и Togaf.
- Използвайте облачни платформи за ефективно съхранение, обработка и управление на данни.
Big Data & Database Основни принципи
14 часаКурсът е част от набора от умения за Data Scientist (Домейн: Данни и технологии).
Azure Data Lake Storage Gen2
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към инженери по данни на средно ниво, които искат да се научат как да използват Azure Data Lake Storage Gen2 за ефективни решения за анализ на данни.
До края на това обучение участниците ще могат:
- Разберете архитектурата и ключовите характеристики на Azure Data Lake Storage Gen2.
- Оптимизирайте съхранението на данни и достъпа за цена и производителност.
- Интегрирайте Azure Data Lake Storage Gen2 с други Azure услуги за анализ и обработка на данни.
- Разработване на решения с помощта на Azure Data Lake Storage Gen2 API.
- Отстранете често срещани проблеми и оптимизирайте стратегиите за съхранение.
Data Vault: Създаване на Мащабируема База Данни
28 часаВ това водено от инструктор обучение на живо в България участниците ще се научат как да изградят Data Vault.
До края на това обучение участниците ще могат:
- Разберете концепциите за архитектурата и дизайна зад Data Vault 2.0 и взаимодействието му с Big Data, NoSQL и AI.
- Използвайте техники за съхранение на данни, за да активирате одит, проследяване и проверка на исторически данни в хранилище за данни.
- Разработете последователен и повторяем ETL (извличане, трансформиране, зареждане) процес.
- Изграждайте и внедрявайте силно мащабируеми и повтарящи се складове.
Data Warehousing: Концепции, Дизайн и Реализация
35 часаData Warehousing ето практиката на проектиране, изграждане и управление на централизирани хранилища на данни, които подкрепят анализи, отчетност и вземане на решения.
Това е обучение с инструктор (онлайн или на място), насочено към данни професионалисти с междуен ниво, които искат да моделират дименсионални данни, да изграждат здрави ETL канали и да оптимизират аналитични натоварвания.
Към края на това обучение участниците ще могат да:
- Обясняват основните концепции и архитектури на Data Warehousing.
- Проектират дименсионални модели и избират между звездообразна и снежна схема.
- Създават и управляват ETL и ELT канали надеждно.
- Различават OLTP и OLAP натоварвания и оптимизират за анализи.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практика.
- Практическа реализация в жива лабораторна среда.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уредите.
Апаче Дрюид за Анализ на Данни в Реално Време
21 часаApache Druid е разпределено хранилище за данни с отворен код, ориентирано към колони, написано на Java. Той е проектиран да поглъща бързо огромни количества данни за събития и да изпълнява OLAP заявки с ниска латентност върху тези данни. Druid обикновено се използва в приложения за бизнес разузнаване за анализиране на големи обеми данни в реално време и исторически данни. Също така е много подходящ за захранване на бързи, интерактивни, аналитични табла за управление за крайни потребители. Druid се използва от компании като Alibaba, Airbnb, Cisco, eBay, Netflix, Paypal и Yahoo.
В този курс на живо, ръководен от инструктори, ние изследваме някои от ограниченията на решенията за съхранение на данни и обсъждаме как Druid може да допълни тези технологии, за да формира гъвкав и мащабируем стек за поточно анализиране. Разглеждаме много примери, предлагайки на участниците шанса да внедрят и тестват базирани на Druid решения в лабораторна среда.
Формат на курса
- Частична лекция, частична дискусия, тежка практическа практика, случайни тестове за измерване на разбирането
Greenplum Administration: Installation, Updates, and Libraries
21 часаGreenplum е платформа за обработка на масивни паралелни данни с отворен код, базирана на PostgreSQL, проектирана за напредени анализи и големи складове на данни.
Този курс с инструктор, проведен жив (онлайн или на място), е предназначен за администратори с интермедиерни знания, които искат да инсталират, конфигурират и управляват среди на Greenplum ефективно, включително управление на обновления на системата и библиотеки.
До края на този курс участващите ще могат да:
- Инсталират и конфигурират продуктивен кластер на Greenplum.
- Управляват обновления на системата и прилагат заплати безопасно.
- Управляват библиотеки на Greenplum за анализи и разширения.
- Разрешават проблеми и мониторират системи на Greenplum.
Формат на курса
- Интерактивни лекции и дискусии.
- Практическо използване на Greenplum в контролирана лабораторна среда.
- Упътващи упражнения, фокусирани върху конфигуриране на кластер, обновяване на работите потокове и разширения на системата.
Опции за персонификация на курса
- За да поставите запрос за персонизиран тренинг за този курс, базиран на вашата среда или платформа за данни, моля свържете се с нас, за да уредите.
899
21 часаGreenplum е платформа за обработка на данни с масово паралелно обработване (MPP), предназначена за анализи и големи обекти за обработка на данни.
Това обучение с инструктор, което се провежда онлайн или на място, е предназначено за технически потребители с интермедиален до напреднал нив на знания, които искат да разберат вътрешната архитектура на Greenplum, да създават оптимизирани модели на данни и да прилагат висока производителност SQL в разпределени среди.
Към края на това обучение участниците ще бъдат способни да:
- Разберат архитектурата на Greenplum за разделено нищо и модел за паралелизъм.
- Проектират разпределени структури на таблици и партиции, оптимизирани за производителност на извличане на данни.
- Използват стратегии за индексиране, формати за съхранение и техники за физически дизайн.
- Интерпретират планове EXPLAIN и оптимизират извличания на данни, използвайки най-добите практики.
Формат на курса
- Интерактивна лекция и дискусия.
- Много упражнения и практики.
- Ръчна имплементация в среда на живо лабораториум.
Опции за персонализиране на курса
- За да попитате персонализирано обучение за този курс, моля свържете се с нас, за да уредите.
Greenplum Database
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към администратори, които желаят да настроят Greenplum Database решения за бизнес разузнаване и съхранение на данни.
До края на това обучение участниците ще могат:
- Обработват нуждите на обработка с Greenplum.
- Извършват операции за извличане, трансформация и зареждане на данни за обработка.
- Използват съществуващи инфраструктури за обработка на заявки.
IBM DataStage за Администратори и Разработчици
35 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към ИТ специалисти на средно ниво, които желаят да имат цялостно разбиране на IBM DataStage както от административна, така и от гледна точка на разработка, което им позволява да управляват и използват това инструмент ефективно на съответните им работни места.
До края на това обучение участниците ще могат:
- Разберете основните концепции на DataStage.
- Научете как ефективно да инсталирате, конфигурирате и управлявате DataStage среди.
- Свържете се с различни източници на данни и извличайте данни ефективно от бази данни, плоски файлове и външни източници.
- Приложете ефективни техники за зареждане на данни.
Апаче Кайлин: Реално време OLAP върху големи данни
14 часаТова обучително занятие с инструктор, което се провежда на живо в България (онлайн или на място), е предназначено за професионалисти в областта на големите данни с среден ниво, които искат да използват Apache Kylin за изграждане на реално време на сгради за данни и извършване на многомерен анализ на големи масиви от данни.
До края на това обучение участниците ще могат да:
- Настроят и конфигурират Apache Kylin с източници на данни за реално време.
- Проектирайте и изграждайте OLAP кубове за както пакетни, така и потокови данни.
- Извършвайте сложни запитвания с латентност от субсекунди, използвайки интерфейса SQL на Kylin.
- Интегрирайте Kylin с инструменти за бизнес интелигентност за интерактивна визуализация на данни.
- Оптимизирайте производителността и управлявайте ресурсите ефективно в Kylin.
Oracle SQL за Разработка и Управление на Бази Данни
35 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към професионалисти в бази данни на средно ниво, които искат да подобрят уменията си в Oracle SQL разработка и администриране.
До края на това обучение участниците ще могат:
- Изградете и оптимизирайте сложни SQL заявки.
- Управлявайте ефективно бази данни с помощта на Oracle SQL инструменти.
- Прилагайте най-добрите практики в разработването и поддръжката на бази данни.
- Администриране на потребителски достъп и сигурност на базата данни в Oracle среда.