Apache Spark MLlib Training Course

MLlib е библиотеката за машинно обучение (ML) на Spark. Целта му е да направи практическото машинно обучение мащабируемо и лесно. Състои се от общи алгоритми и помощни програми за обучение, включително класификация, регресия, клъстериране, съвместно филтриране, намаляване на размерността, както и примитиви за оптимизация от по-ниско ниво и приложни програмни интерфейси за конвейер от по-високо ниво.

Разделя се на два пакета:

spark.mllib съдържа оригиналния API, изграден върху RDD. spark.ml предоставя API от по-високо ниво, изграден върху DataFrames за конструиране на ML тръбопроводи.

Публика

Този курс е насочен към инженери и разработчици, които искат да използват вградена машинна библиотека за Apache Spark

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Oтзиви от потребители (1)

Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение

Rafał - Nordea

Course - Apache Spark MLlib

Machine Translated

Свързани Kурсове

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Big Data Analytics in Health

21 Hours

Анализът на големи данни включва процеса на изследване на големи количества разнообразни набори от данни, за да се разкрият корелации, скрити модели и други полезни прозрения.

Здравната индустрия разполага с огромно количество сложни разнородни медицински и клинични данни. Прилагането на анализ на големи данни върху здравни данни представлява огромен потенциал за извличане на прозрения за подобряване на предоставянето на здравни грижи. Огромността на тези набори от данни обаче поставя големи предизвикателства в анализите и практическите приложения в клинична среда.

В това водено от инструктор обучение на живо (дистанционно) участниците ще се научат как да извършват анализ на големи данни в здравеопазването, докато преминават през поредица от практически лабораторни упражнения на живо.

До края на това обучение участниците ще могат:

Инсталирайте и конфигурирайте инструменти за анализ на големи данни като Hadoop MapReduce и Spark Разбирайте характеристиките на медицинските данни Прилагайте техники за големи данни за работа с медицински данни Изучавайте системи и алгоритми за големи данни в контекста на здравни приложения

Публика

Разработчици Учени по данни

Формат на курса

Част лекция, част дискусия, упражнения и тежка практическа практика.

Забележка

За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.

Прочети повече...