План на курса

Въведение

Принципи на разпределеното изчисление

    Apache Spark Hadoop

Принципи на Data Serialization

    Как обектът с данни се предава по мрежата Сериализация на обекти Подходи за сериализация Thrift Protocol Buffers Apache Avro размер на структурата на данните, скорост, характеристики на формата постоянно съхранение на данни интеграция с динамични езици схеми за динамично въвеждане немаркирани управление на промяна на данни

Data Serialization и Разпределено изчисление

    Avro като подпроект на Hadoop Java сериализация Hadoop сериализация Avro сериализация

Използвайки Avro с

    Hive (AvroSerDe) Прасе (AvroStorage)

Пренасяне на съществуващи RPC рамки

Обобщение и заключение

Изисквания

  • Общо запознаване с разпределените изчисления.
  14 Hours

Брой участници



Цена за участник

Oтзиви от потребители (3)

Свързани Kурсове

Hadoop For Administrators

  21 Hours

Samza for Stream Processing

  14 Hours

Datameer for Data Analysts

  14 Hours

Свързани Kатегории