План на курса

Основи на NiFi и потока на данни

  • Данни в движение спрямо данни в покой: концепции и предизвикателства
  • Архитектура на NiFi: ядра, контролер на потока, доказателство за източник и съобщения
  • Ключови компоненти: процесори, свързаност, контролери и доказателства за източник

Български контекст и интеграция

  • Ролята на NiFi в екосистемите с големи данни (Hadoop, Kafka, облачно съхранение)
  • Преглед на HDFS, MapReduce и moderne альтернативи
  • Сценарии: изтегляне на потокове, логически транспорти, пайлини за събития

Инсталиране, конфигуриране и настройка на кластера

  • Инсталиране на NiFi в односно режим или кластерен режим
  • Конфигуриране на кластера: роли на узлите, Zookeeper и балансиране на натоварването
  • Оркестриране на разположенията на NiFi: с използване на Ansible, Docker или Helm

Проектиране и управление на потокове

  • Маршрутизация, филтриране, разделяне и съединяване на потоци
  • Конфигуриране на процесори (InvokeHTTP, QueryRecord, PutDatabaseRecord и др.)
  • Обработка на схеми, обогатяване и трансформация на операции
  • Обработка на грешки, възстановяване на връзки при грешка и бекпресинг

Сценарии за интеграция

  • Свързване с бази данни, системи за съобщения и REST API-та
  • Потоци към аналитични системи: Kafka, Elasticsearch или облачно съхранение
  • Интеграция с Splunk, Prometheus или логически пайлини

Мониторинг, възстановяване и доказателство за източник

  • Използване на потребителския интерфейс на NiFi, метрики и визуализатор на доказателства за източник
  • Проектиране на самостоятелно възстановяване и грациозна обработка на грешки
  • Резервно копиране, версиониране на потока и управление на промени

Оптимизация и подобрение на производителността

  • Подобряване на JVM, heap, нишки и параметри за кластеризация
  • Оптимизиране на проектирането на потока за намаляване на бутонални точки
  • Изолация на ресурси, приоритизиране на потокове и контрол на преминаването

Лучши практики и управление

  • Документация за потока, стандартни имена, модулно проектиране
  • Сигурност: TLS, аутентикация, контрол на достъп, криптиране на данни
  • Управление на промени, версиониране, роля базиран достъп и аудит на следите

Разследване на проблеми и реакция при инциденти

  • Често срещани проблеми: дедлокове, утечки памет, грешки в процесорите
  • Анализ на логовете, диагностика на грешки и разследване на коренните причини
  • Стратегии за възстановяване и отката на потока

Лабораторна практика: Реално изпълнение на потокова линия за данни

  • Изграждане на потока от начало до край: влизане, трансформация и доставка
  • Реализиране на обработка на грешки, бекпресинг и масштабиране
  • Тест за производителност и оптимизация на потока

Резюме и следващи стъпки

Изисквания

  • Опит с Linux команден ред
  • Основно разбиране на мрежи и данни
  • Запознаност с потоци на данни или концепции за ETL (Extract, Transform, Load)

Публика

  • Системни администратори
  • Инженери на данните
  • Разработчици
  • Профессионалисти DevOps
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (7)

Предстоящи Курсове

Свързани Kатегории