Курс за обучение по Програма по Данни Науки
Експлозията от информация и данни в днешния свят е несравнима, способността ни да правим иновации и да прекрачваме границите на възможното нараства по-бързо от всякога. Ролята на Data Scientist е едно от най-търсените умения в индустрията днес.
Ние предлагаме много повече от обучение чрез теория; ние предоставяме практически, продаваеми умения, които преодоляват пропастта между света на академичните среди и изискванията на индустрията.
Тази 7-седмична учебна програма може да бъде съобразена с вашите специфични изисквания на индустрията, моля свържете се с нас за допълнителна информация или посетете уебсайта на Nobleprog Institute
Публика:
Тази програма е насочена към висшисти, както и към всеки с необходимите предварителни умения, които ще бъдат определени чрез оценка и интервю.
Доставка:
Предоставянето на курса ще бъде комбинация от класна стая, водена от инструктор, и онлайн водена от инструктор; обикновено първата седмица ще бъде „водена от класна стая“, седмици 2 – 6 „виртуална класна стая“ и седмица 7 обратно към „водена от класна стая“.
План на курса
Седмица 1 Big Data концепции
- Дефиниция на VVVV (скорост, обем, разнообразие, достоверност) Ограничения на традиционния капацитет за обработка на данни Разпределена обработка Статистически анализ Машинно обучение Видове анализи Визуализация на данни Разпределена обработка (напр. map-reduce) Въведение в използваните езици Интензивен курс на R език Python интензивен курс
Седмици 2 и 3 Изпълнение Data Analysis
- Статистически анализ Описателен Statistics в набори от големи данни (напр. изчисляване на средна стойност) Инференциален Statistics (оценка) Прогнозиране с модели на корелация и регресия Анализ на времеви редове Основи на машинното обучение Учене под надзор срещу неконтролирано обучение Класификация и клъстериране Оценка на разходите за специфични методи Филтър
Седмица 4 Обработка на естествен език
- Обработка на текст Разбиране на смисъла на текста Автоматично генериране на текст Анализ на настроение/тема Computer Vision
Седмица 5 и 6 Концепция за инструменти
- Решение за съхранение на данни (SQL, NoSQL, йерархично, обектно ориентирано, ориентирано към документи) MySQL, Cassandra, MongoDB, Elasticsearch, HDFS и др...) Избор на правилното решение на проблема Разпределена обработка Spark Machine Learning с Spark (MLLib) Spark SQL Мащабируемост Публичен облак (AWS, Google и т.н...) Частен облак (OpenStack, облачна леярна) Автоматично мащабируемост
Седмица 7 Soft Skills
- Консултантски и Leadership умения Оказване на въздействие: разказване на истории, основано на данни Разбиране на вашата аудитория Ефективно представяне на данни – предаване на вашето послание Ефективност на влиянието и промяна на лидерството Справяне с трудни ситуации
Изпит
- Краен изпит по програмата
Изисквания
Участниците трябва да имат добри познания по математика, най-малко средно ниво.
Въпреки че не са необходими умения за програмиране, всякакви умения по програмиране ще бъдат полезни.
Участниците ще бъдат оценени и интервюирани преди участие в тази програма за обучение.
Отворените курсове за обучение изискват 5+ участника.
Курс за обучение по Програма по Данни Науки - Booking
Курс за обучение по Програма по Данни Науки - Enquiry
Програма по Данни Науки - Консултантско запитване
Консултантско запитване
Отзиви от потребители (5)
Разбиране на големи данни по-добре
Shaune Dennis - Vodacom
Курс - Big Data Business Intelligence for Telecom and Communication Service Providers
Машинен превод
Обучението беше подходящо. И в действителност, много ми беше подкрепително да се запиша за курса.
Grace Goh - DBS Bank Ltd
Курс - Python in Data Science
Машинен превод
Тема представяне на знания за времето
Aly Saleh - FAB banak Egypt
Курс - Introduction to Data Science and AI (using Python)
Машинен превод
Също е страхотно да бъде курсът нареден спрямо ключовите области, които съм обозначил в предходния анкетен лист. Това е много полезно за да отговаря на въпросите, които имам по темата, и да бъде в съответствие с целите ми за обучение.
Winnie Chan - Statistics Canada
Курс - Jupyter for Data Science Teams
Машинен превод
Това показва много методи с предварително подготвени скриптове - много добре подготвени материали и лесно за проследяване
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Курс - Machine Learning – Data science
Машинен превод
Предстоящи Курсове
Свързани Kурсове
Въведение в Data Science и ИИ чрез използване на Python
35 часаТое е 5-дневно введение в науката за данни и изкуствен интелигент (AI).
Курсът се провежда с пример и упражнения с използване на Python.
Екосистема за Data Scientists
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към специалисти по данни, които желаят да използват екосистемата Anaconda за улавяне, управление и внедряване на пакети и работни процеси за анализ на данни в една платформа.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Anaconda компоненти и библиотеки.
- Разберете основните концепции, функции и предимства на Anaconda.
- Управлявайте пакети, среди и канали с помощта на Anaconda Навигатор.
- Използвайте пакети Conda, R и Python за наука за данни и машинно обучение.
- Запознайте се с някои практически случаи и техники за управление на множество среди с данни.
Big Data Business Intelligence за Telecom и Communication провайдери на услуги
35 часаПреглед
Communication доставчиците на услуги (CSP) се сблъскват с натиск, за да намалят разходите и да максимизират средния доход на потребител (ARPU), като същевременно осигуряват отличен клиентски опит, но обемите на данните продължават да растат. Глобален мобилен трафик на данни ще расте с комбиниран годишен темп на растеж (CAGR) от 78% до 2016 г., достигайки 10,8 екзабит на месец.
Междувременно CSPs генерират големи обеми данни, включително записи за подробности за обаждания (CDR), данни за мрежата и данни за клиентите. Компаниите, които напълно експлоатират тези данни, получават конкурентен ръб. Според неотдавнашно проучване на The Economist Intelligence Unit, компаниите, които използват вземане на решения, насочени към данни, получават 5-6% увеличение на производителността. Въпреки това 53% от компаниите използват само половината от ценните си данни, а една четвърт от анкетираните отбелязват, че огромни количества полезни данни са пропуснати. Обемът на данните е толкова висок, че ръчното анализиране е невъзможно и повечето софтуерни системи могат да се запазят, което води до пренебрегване или пренебрегване на ценни данни.
С Big Data & Analytics’ високоскоростен, скалиращ софтуер за големи данни, CSPs могат да минат всичките си данни за по-добро вземане на решения в по-малко време. Различни Big Data продукти и техники осигуряват крайно-на-крайната софтуерна платформа за събиране, подготовка, анализ и представяне на увид от големите данни. Областите на приложенията включват мониторинг на мрежовата ефективност, откриване на измами, откриване на клиентите и анализ на кредитния риск. Big Data & Продукти за анализ мащаб за обработка на терабити от данни, но изпълнението на такива инструменти изисква нов вид на база данни на облака система като Hadoop или масивен мащаб паралелен компютър процесор ( KPU и т.н.)
Този курс работи върху Big Data BI за Telco обхваща всички възникващи нови области, в които CSP инвестират за увеличаване на производителността и отваряне на нов бизнес поток на приходи. Курсът ще осигури пълен 360 градуса поглед върху Big Data BI в Telco, така че вземащите решения и мениджърите могат да имат много широк и цялостен преглед на възможностите на Big Data BI в Telco за производителност и печалби.
Цели на курса
Основната цел на курса е да се въведат нови Big Data бизнес интелигентни техники в 4 сектори на Telecom Business (Marketing / продажби, мрежови операции, финансови операции и взаимоотношения с клиентите Management). Студентите ще бъдат поканени да следват:
- Въведение в Big Data-което е 4Vs (обем, скорост, разнообразие и вертикалност) в Big Data- Генерация, екстракция и управление от перспектива на Telco
- Как Big Data анализът се различава от наследствения анализ на данните
- Вътрешно оправдание на Big Data -Telco перспектива
- Въведение в Hadoop Екосистема- запознаване с всички Hadoop инструменти като Hive, Pig, SPARC –кога и как те се използват за решаване на проблема Big Data
- Как Big Data е извлечен за анализ за аналитичен инструмент-как Business Analysis’s могат да намалят техните точки на болка на събиране и анализ на данни чрез интегриран Hadoop подход на таблата
- Основно въведение в анализа на Insight, анализа на визуализацията и прогнозната анализа за Telco
- Анализът на клиента и Big Data-как Big Data анализът могат да намалят недоволството на клиента и недоволството на клиента в изследванията на Telco-каса
- Анализ на мрежови неуспехи и сервизни неуспехи от мрежови метаданни и IPDR
- Финансов анализ - измама, измама и оценка на ROI от продажбите и оперативните данни
- Проблеми с закупуването на клиенти-Целена маркетинг, сегментация на клиентите и кръстопродажба от данни за продажбите
- Въведение и обобщение на всички Big Data аналитични продукти и къде се вписват в аналитичното пространство на Telco
- Заключение-как да се вземе стъпка по стъпка подход за въвеждане Big Data Business Intelligence в организацията си
Целенасочена аудитория
- Операция на мрежата, финансови мениджъри, CRM мениджъри и топ ИТ мениджъри в офиса на Telco CIO.
- Business Аналитикуващи в Telco
- Мениджъри / Аналитици на CFO
- Оперативни мениджъри
- КА мениджъри
Практическо въведение в науката за данните
35 часаУчастниците, които завършат това обучение, ще придобият практическо, реално разбиране за Data Science и свързаните с него технологии, методологии и инструменти.
Участниците ще имат възможност да приложат тези знания на практика чрез практически упражнения. Груповото взаимодействие и обратната връзка с инструктора са важен компонент на класа.
Курсът започва с въведение в елементарните концепции на Data Science, след което преминава към инструментите и методологиите, използвани в Data Science.
Публика
- Разработчици Технически анализатори ИТ консултанти
Формат на курса
- Част лекция, част дискусия, упражнения и тежка практическа практика
Забележка
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Науки за данни за анализ на големи данни
35 часаГолемите данни са набори от данни, които са толкова обемни и сложни, че традиционният приложен софтуер за обработка на данни е неадекватен да се справи с тях. Предизвикателствата с големи данни включват улавяне на данни, съхранение на данни, анализ на данни, търсене, споделяне, трансфер, визуализация, заявки, актуализиране и поверителност на информацията.
Наука за данни е необходима за професионалисти в маркетинга/продажби
21 часаТози курс е предназначен за Marketing специалисти по продажбите, които възнамеряват да навлязат по-дълбоко в приложението на науката за данни в Marketing/продажби. Курсът предоставя подробно покритие на различни техники за наука за данни, използвани за „допълнителна продажба“, „кръстосана продажба“, сегментиране на пазара, брандиране и CLV.
Разлика между Marketing и продажбите - Как се различават продажбите и маркетингът?
С много прости думи продажбите могат да бъдат определени като процес, който се фокусира или е насочен към индивиди или малки групи. Marketing от друга страна е насочен към по-голяма група или широката публика. Marketing включва проучване (идентифициране на нуждите на клиента), разработване на продукти (производство на иновативни продукти) и популяризиране на продукта (чрез реклами) и създаване на информираност за продукта сред потребителите. Като такъв маркетинг означава генериране на потенциални клиенти или перспективи. След като продуктът е на пазара, задачата на продавача е да убеди клиента да купи продукта. Продажбите означават превръщане на потенциални клиенти или перспективи в покупки и поръчки, докато маркетингът е насочен към по-дълги срокове, продажбите се отнасят към по-кратки цели.
Начало на науката за данни
35 часаТова водено от инструктор обучение на живо (онлайн или на място) е насочено към професионалисти, които желаят да започнат кариера в Data Science.
До края на това обучение участниците ще могат:
- Инсталирайте и конфигурирайте Python и MySql. Разберете какво е Data Science и как може да добави стойност към практически всеки бизнес. Научете основите на кодирането в Python Научете контролирани и неконтролирани техники за машинно обучение и как да ги прилагате и интерпретирате резултатите.
Формат на курса
- Интерактивна лекция и дискусия. Много упражнения и практика. Практическо внедряване в лабораторна среда на живо.
Опции за персонализиране на курса
- За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
Jupyter за отбори по данни науки
7 часаТова обучение с инструктор, провеждано на живо (онлайн или на място), представя идеята за съвместно разработване в науката за данни и демонстрира как да използвате Jupyter за следене и участие като отбор в "живота на компютърна идея". То води участниците през създаването на примерен проект за наука за данни, базиран върху екосистемата на Jupyter.
До края на това обучение участниците ще бъдат способни да:
- Инсталират и конфигурират Jupyter, включително създаването и интеграцията на отборен репозиторий на Git.
- Използват функции на Jupyter, като разширения, интерактивни виджета, режим за многопотребители и други, за да осигурят съвместна работа по проекта.
- Създават, споделят и организират Jupyter Notebooks с членове на отбора.
- Избират между Scala, Python, R, за да пишат и изпълняват код към големи системи за данни, като Apache Spark, всичко през интерфейса на Jupyter.
Kaggle
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към учени и разработчици на данни, които желаят да учат и изградят кариерата си в Data Science с помощта на Kaggle.
До края на това обучение участниците ще могат:
- Научете за науката за данните и машинното обучение.
- Разгледайте анализа на данни.
- Научете за Kaggle и как работи.
MATLAB Основни, Науки за Данни & Създаване на Отчети
35 часаВ първата част на това обучение разглеждаме основите на MATLAB и функцията му като език и платформа. В тази дискусия е включено въведение в MATLAB синтаксиса, масивите и матриците, визуализацията на данни, разработването на скриптове и обектно-ориентираните принципи.
Във втората част ние демонстрираме как да използваме MATLAB за извличане на данни, машинно обучение и прогнозен анализ. За да предоставим на участниците ясна и практична перспектива за подхода и силата на MATLAB, ние правим сравнения между използването на MATLAB и използването на други инструменти като електронни таблици, C, C++ и Visual Basic.
В третата част на обучението участниците се научават как да рационализират работата си чрез автоматизиране на обработката на данните и генерирането на отчети.
По време на курса участниците ще приложат на практика идеите, научени чрез практически упражнения в лабораторна среда. До края на обучението участниците ще имат задълбочена представа за възможностите на MATLAB и ще могат да го използват за решаване на реални проблеми с науката за данни, както и за рационализиране на работата си чрез автоматизация.
По време на курса ще се извършват оценки, за да се оцени напредъкът.
Формат на курса
- Курсът включва теоретични и практически упражнения, включително дискусии по казуси, проверка на примерен код и практическо внедряване.
Забележка
- Практическите сесии ще се основават на предварително подготвени примерни шаблони за отчет с данни. Ако имате специфични изисквания, моля свържете се с нас, за да уговорим.
Machine Learning за Data Science с Python
21 часаТова обучение с инструктор на живо (онлайн или на място) е направено за данни анализи, разработчици или начинаещи научни работници по данни на среден ниво, които искат да приложат техники на машинообучение в Python, за да извличат инсайти, правят прогнози и автоматизират решения, базирани на данни.
До края на този курс участниците ще могат да:
- Разбират и различават ключовите парадигми на машинообучение.
- Разследват техники за предварителна обработка на данни и метрики за оценка на модели.
- Прилагат алгоритми на машинообучение за решаване на реални проблеми с данни.
- Използват библиотеки на Python и Jupyter notebooks за практическо разработване.
- Създават модели за прогнозиране, класификация, препоръки и кластеризация.
Ускоряване на Python Pandas Workflows с Modin
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към специалисти по данни и разработчици, които желаят да използват Modin за изграждане и прилагане на паралелни изчисления с Pandas за по-бърз анализ на данни.
До края на това обучение участниците ще могат:
- Настройте необходимата среда, за да започнете да разработвате Pandas работни потоци в мащаб с Modin.
- Разберете характеристиките, архитектурата и предимствата на Modin.
- Познайте разликите между Modin, Dask и Ray.
- Изпълнете Pandas операции по-бързо с Modin.
- Внедрете целия Pandas API и функции.
Python Programming за Финанси
35 часаPython е език за програмиране, който придоби огромна популярност във финансовата индустрия. Приет от най-големите инвестиционни банки и хедж фондове, той се използва за изграждане на широка гама от финансови приложения, вариращи от основни програми за търговия до системи за управление на риска.
В това водено от инструктор обучение на живо участниците ще се научат как да използват Python за разработване на практически приложения за решаване на редица специфични проблеми, свързани с финансите.
До края на това обучение участниците ще могат:
- Да разберат основите на програмния език Python
- Да изтеглят, инсталират и поддържат най-добрите инструменти за разработка за създаване на финансови приложения в Python
- Да избират и използват най-подходящите пакети и програмни техники на Python за организиране, визуализиране и анализиране на финансови данни от различни източници (CSV, Excel, бази данни, уеб и др.)
- Да изграждат приложения, които решават проблеми, свързани с разпределението на активите, анализа на риска, инвестиционната ефективност и други
- Да отстраняват грешки, интегрират, разгръщат и оптимизират приложение на Python
Публика
- Разработчици
- Анализатори
- Количествени анализатори (Quants)
Формат на курса
- Комбинация от лекции, дискусии, упражнения и интензивна практическа работа
Забележка
- Това обучение има за цел да предостави решения на някои от основните проблеми, пред които са изправени финансовите специалисти. Ако обаче имате конкретна тема, инструмент или техника, върху която искате да наблегнете или да разширите, моля, свържете се с нас, за да я обсъдим.
Python в науката за данни
35 часаКурсът ще помогне на участниците да се подготвят за разработване на уеб приложения, като използват Python Programming с Data Analytics. Такова визуализиране на данни е чудесен инструмент за Топ Management в вземането на решения.
GPU Data Science с NVIDIA RAPIDS
14 часаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към учени и разработчици на данни, които желаят да използват RAPIDS за изграждане на GPU-ускорени канали за данни, работни потоци и визуализации, прилагайки алгоритми за машинно обучение, като XGBoost, cuML и др.
До края на това обучение участниците ще могат:
- Настройте необходимата среда за разработка за изграждане на модели на данни с NVIDIA RAPIDS.
- Разберете характеристиките, компонентите и предимствата на RAPIDS.
- Използвайте GPU за ускоряване на тръбопроводите за данни и анализи от край до край.
- Внедрете GPU-ускорена подготовка на данни и ETL с cuDF и Apache Arrow.
- Научете как да изпълнявате задачи за машинно обучение с алгоритми XGBoost и cuML.
- Изградете визуализации на данни и изпълнете анализ на графики с cuXfilter и cuGraph.