План на курса

Разбивка на темите на дневна база: (Всяка сесия е 2 часа)

Ден-1: Сесия -1: Общ бизнес преглед на защо Big Data Business Intelligence в Telco.

    Казуси от T-Mobile, Verizon и т.н. Степен на адаптиране на големи данни в северноамериканските телекомуникационни компании и как те привеждат в съответствие своя бъдещ бизнес модел и работа около Big Data BI Широкомащабна област на приложение, мрежа и управление на услуги Отлив на клиенти Management Интегриране на данни и Визуализация на таблото за управление Управление на измами Генериране на бизнес правила Профилиране на клиенти Локализирано натискане на реклами

Ден-1: Сесия-2 : Представяне на Big Data-1

    Основни характеристики на Big Data-обем, разнообразие, скорост и достоверност. MPP архитектура за обем. Data Warehouses – статична схема, бавно развиващ се набор от данни MPP Бази данни като Greenplum, Exadata, Teradata, Netezza, Vertica и т.н. Решения, базирани на Hadoop – няма условия за структурата на набора от данни. Типичен модел : HDFS, MapReduce (crunch), извличане от HDFS Пакетно подходящ за аналитични/неинтерактивни томове : CEP поточно предаване на данни Типични избори – CEP продукти (напр. Infostreams, Apama, MarkLogic и др.) По-малко готови за производство – Storm/S4 NoSQL бази данни – (колона и ключ-стойност): Най-подходящ като аналитична добавка към хранилище/база данни

Ден-1 : Сесия -3 : Въведение в Big Data-2

Няма SQL решения

    KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB) KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB KV Store (Йерархичен) - GT.m, Кеш KV Store (Поръчан) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua Tuple Store - Gigaspaces, Coord, Apache River Object Database - ZopeDB, DB40, Shoal Document Store - CouchDB, Cloudant , Couchbase, MongoDB, Jackrabbit, XML-бази данни, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Разновидности на данните: Въведение в Data Cleaning проблем в Big Data

    RDBMS – статична структура/схема, не насърчава гъвкава, изследователска среда. NoSQL – полуструктурирана, достатъчно структура за съхраняване на данни без точна схема преди съхраняване на данни Проблеми с почистването на данни

Ден-1 : Сесия-4 : Въведение в големи данни-3 : Hadoop

    Кога да изберете Hadoop? СТРУКТУРИРАНИ – Корпоративните хранилища/бази данни могат да съхраняват масивни данни (на цена), но налагат структура (не е добра за активно проучване) ПОЛУСТРУКТУРИРАНИ данни – трудно се прави с традиционните решения (DW/DB) Складиране на данни = ГОЛЯМО усилие и статично дори след внедряване За разнообразие и обем от данни, обработени със стандартен хардуер – HADOOP Commodity H/W е необходим за създаване на Hadoop клъстер

Въведение в Map Reduce /HDFS

    MapReduce – разпределете изчисленията върху множество сървъри HDFS – направете данните достъпни локално за изчислителния процес (с излишък) Данни – могат да бъдат неструктурирани/без схеми (за разлика от RDBMS) Отговорност на разработчиците за осмисляне на данните Programming MapReduce = работа с Java ( плюсове/против), ръчно зареждане на данни в HDFS

Ден-2: Сесия-1.1: Spark: Разпределена база данни в паметта

    Какво представлява обработката „В паметта“? Spark SQL Spark SDK Spark API RDD Spark Lib Hanna Как да мигрирам съществуваща Hadoop система към Spark

Ден-2 сесия -1.2: Буря - Обработка в реално време в Big Data

    Потоци Sprouts Болтове Топологии

Ден-2: Сесия-2: Система за големи данни Management.

    Движещи се части, изчислителни възли стартират/отказват: ZooKeeper - За услуги за конфигуриране/координиране/именуване Комплексен тръбопровод/работен поток: Oozie – управление на работния процес, зависимости, последователна верига Разполагане, конфигуриране, управление на клъстери, надграждане и т.н. (системен администратор) :Ambari In Cloud: Инструменти на платформата Whirr Evolving Big Data за проследяване на проблеми с приложението на ETL слой

Ден-2: Сесия-3: Предсказуеми анализи в Business Intelligence -1: Основни техники и BI, базирани на машинно обучение:

    Въведение в машинното обучение Техники за класификация на обучението Bayesian Prediction-preparing training file Марковско произволно поле Контролирано и неконтролирано обучение Извличане на функции Поддържащо векторно машинно невронно мрежово обучение Подсилване Big Data проблем с голяма променлива - Случайна гора (RF) Представяне обучение Дълбоко обучение Big Data Проблем с автоматизацията – Многомоделен ансамбъл RF автоматизация чрез Soft10-M LDA и тематично моделиране Гъвкаво обучение Обучение, базирано на агенти – Пример от работа на Telco Разпределено обучение – Пример от работа на Telco Въведение в Инструменти с отворен код за прогнозни анализи: R, Rapidminer, Mahut По-мащабируеми Analytic- Apache Hama, Spark и CMU Graph lab

Ден-2: Сесия-4 Екосистема за прогнозен анализ 2: Често срещани проблеми с прогнозен анализ в Telecom

    Анализ на прозрения Анализ на визуализация Структуриран предсказуем анализ Неструктуриран предсказуем анализ Профилиране на клиенти Механизъм за препоръки Откриване на шаблони Откриване на правило/сценарий – неуспех, измама, оптимизация Откриване на първопричината Анализ на настроението CRM анализ Анализ на мрежата Текстов анализ Технологично подпомаган преглед Анализ на измами Анализ в реално време

Ден-3: Сесия-1: Анализ на работата на мрежата – анализ на първопричината за сривове в мрежата, прекъсване на услугата от метаданни, IPDR и CRM:

    Използване на CPU Използване на памет QoS Използване на опашка Устройство Температура Грешка на интерфейса IoS версии Routing Events Latency variations Syslog analytics Симулация на загуба на пакети Load Inference Performance Threshold Device Traps Събиране и обработка на IPDR (IP подробен запис) Използване на IPDR данни за потребление на честотна лента на абоната, използване на мрежов интерфейс , състояние на модема и диагностична HFC информация

Ден-3: Сесия-2: Инструменти за анализ на отказ на мрежова услуга:

    Табло за обобщение на мрежата: наблюдавайте цялостното разгръщане на мрежата и проследявайте ключовите показатели за ефективност на вашата организация Табло за анализ на пиков период: разберете тенденциите на приложенията и абонатите, водещи до пиково използване, със специфична за местоположението детайлност Табло за управление на ефективността на маршрутизиране: контролирайте мрежовите разходи и изграждайте бизнес казуси за капиталови проекти с пълно разбиране на взаимосвързаността и транзитните връзки Табло за управление на забавленията в реално време: достъп до показатели, които имат значение, включително гледания на видео, продължителност и качество на изживяването (QoE) Табло за управление на прехода към IPv6: проучете текущото приемане на IPv6 във вашата мрежа и получете представа за приложенията и устройствата, водещи до тенденции Казус-1: Голям мрежов анализ (BNA) на Alcatel-Lucent Data Miner Многоизмерен мобилен интелект (m.IQ6)

Ден-3: Сесия 3: Big Data BI за Marketing/Продажби – Разбиране на продажбите/маркетинга от данните за продажбите: (Всички те ще бъдат показани с демонстрация на прогнозен анализ на живо)

    За идентифициране на клиенти с най-висока скорост За идентифициране на клиенти за дадени продукти За идентифициране на правилния набор от продукти за клиент (Recommendation Engine) Техника за пазарно сегментиране Техника за кръстосана продажба и upsale Техника за сегментиране на клиенти Техника за прогнозиране на приходите от продажби

Ден 3: Сесия 4: BI необходим за офиса на финансовия директор на Telco:

    Преглед на Business Аналитични работи, необходими в офис на финансов директор Анализ на риска при нови инвестиции Приходи, прогнозиране на печалби Прогнози за придобиване на нови клиенти Прогнозиране на загуби Анализ на измами във финансите (подробности следващата сесия)

Ден-4: Сесия-1: BI за предотвратяване на измами от Big Data в Telco-Fraud analytic:

    Изтичане на честотна лента / измама с честотна лента Измами с доставчици/прекомерно таксуване за проекти Измами с възстановяване на средства/искове на клиенти Измами с възстановяване на разходи за пътуване

Ден-4 : Сесия-2: От прогнозиране на отлив до предотвратяване на отлив:

    3 вида напускане: активно/преднамерено, ротационно/инцидентно, пасивно неволно 3 класификация на изхвърлените клиенти: общо, скрито, частично Разбиране на CRM променливите за напускане Събиране на данни за поведението на клиентите Събиране на данни за възприятието на клиентите Събиране на демографски данни на клиентите Почистване на CRM данни Неструктурирани CRM данни ( клиентски обаждания, билети, имейли) и тяхното преобразуване в структурирани данни за анализ на отлив Social Media CRM-нов начин за извличане на индекс на удовлетвореността на клиентите Казус-1: T-Mobile САЩ: Намаляване на отливите с 50%

Ден-4: Сесия-3: Как да използваме прогнозен анализ за анализ на първопричината за неудовлетвореността на клиентите:

    Казус от практиката -1: Свързване на неудовлетвореността с проблемите – Счетоводство, инженерни грешки като прекъсване на услугата, услуга с лоша честотна лента Казус от практиката-2: Big Data QA табло за проследяване на индекса на удовлетвореност на клиентите от различни параметри като ескалация на обажданията, критичност на проблемите, чакаща услуга събития на прекъсване и др.

Ден-4: Сесия-4: Big Data Табло за бърз достъп до различни данни и дисплей:

    Интегриране на съществуваща платформа за приложения с табло за управление на големи данни Управление на големи данни Казус от табло за управление на големи данни: Tableau и Pentaho Използвайте приложение за големи данни, за да прокарате базирана на местоположение система за проследяване и управление на реклами

Ден-5: Сесия-1: Как да обосновем Big Data внедряването на BI в организация:

    Определяне на възвръщаемостта на инвестициите за Big Data внедряване Казуси за спестяване на време на анализатор за събиране и подготовка на данни – повишаване на печалбата в производителността Казуси за печалба от приходите от оттеглянето на клиенти Печалба от приходи от базирана на местоположението и друга насочена реклама Интегриран подход на електронна таблица за изчисляване на прибл. разходи срещу печалби/спестявания от Big Data приходи.

Ден-5: Сесия-2: Стъпка по стъпка процедура за замяна на наследената система за данни на Big Data Система:

    Разбиране на практическата Big Data Пътна карта за миграция Каква е важната информация, необходима преди проектирането на Big Data внедряване Какви са различните начини за изчисляване на обем, скорост, разнообразие и достоверност на данните Как да оцените растежа на данните Казуси в 2 Telco

Ден 5: Сесия 3 и 4: Преглед на Big Data доставчици и преглед на техните продукти. Q/A сесия:

    AccentureAlcatel-Lucent Amazon –A9 APTEAN (по-рано CDC Software) Cisco Systems Cloudera Dell EMC GoodData Corporation Guavus Hitachi Data Systems Hortonworks Huawei HP IBM Informatica Intel Jaspersoft Microsoft MongoDB (по-рано 10Gen) MU Sigma Netapp Opera Solutions Oracle Pentaho Platfora Qliktech Quantum Rackspace Revolution Analytics Salesforce SAP SAS Institute Sisense Software AG/Terracotta Soft10 Automation Splunk Sqrrl Supermicro Tableau Software Teradata Think Big Analytics Tidemark Systems VMware (част от EMC)

Изисквания

  • Трябва да има основни познания за бизнес операции и системи за данни в Telecom в своята област
  • Трябва да има основно разбиране за SQL/Oracle или релационна база данни
  • Основно разбиране на статистиката (в нива на Excel)
 35 Hours

Брой участници



Цена за участник

Oтзиви от потребители (3)

Свързани Kурсове

GPU Data Science with NVIDIA RAPIDS

14 Hours

Свързани Kатегории