- Сourse
- Location
Курс «Аналитика больших данных для менеджеров» предоставляет необходимые знания для участия в проектах по анализу больших данных.
Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data. На курсе вы узнаете базовые и расширенные методы аналитики и техники поиска и извлечения знаний из больших массивов разнородных данных. Программа обучения включает сравнение различных версий дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики данных, «open source« и коммерческие инструменты используемые для хранения, обработки, визуализации и аналитики больших данных.
В программе обучения подробно рассматриваются сценарии применения технологий работы с Большими Данными (Big Data) в различных отраслях бизнеса (Банки и финансовые учреждения, промышленность, торговля и транспорт) и организациях государственного сектора. Мы подробно изучим процесс инициации проекта по цифровизации предприятия (сбора больших данных, формирования команды проекта по аналитике больших данных) и рассмотрим все фазы жизненного цикла работы с большими данными (подготовка данных, выбор модели, пилотное развертывание и тестирование модели, промышленная эксплуатация).
В курсе особое внимание уделяется вопросам работы с персональными данными и обеспечение безопасности при работе с большими данными. Материалы содержат много реальных примеров (use cases) монетизации больших данных в Российском и мировом бизнесе. Особое внимание уделено условиям импортозамещения, а также возможные сложности и специфика использования при работе с большими данными для различных секторов экономики в России.
Если вы хотите разбираться:
- в основных понятиях мира Больших Данных, Машинного обученияи Интернета Вещей;
- знать, в чем отличие разных версий дистрибутивов Hadoop, Spark, NoSQL или Kafka;
- назначение компонентов экосистемы Hadoop, Spark, Kafka;
- нюансы облачных решений;
- что такое стандарт GDPR;
- особенности Индустриального интернета Вещей;
приглашаем Вас на обучение в «Школу Больших Данных»
Программа курса
-
Введение в Big Data (Большие данные)
- Большие данные и цифровизация данных
- Методы аналитики больших данных
- Отраслевая специфика аналитики больших данных
- Сценарии применения технологий больших данных
- Жизненный цикл аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
- Формирование озера данных Data Lake
-
Data Mining — извлечение знаний из больших данных
- Задачи и техники Data Mining
- Классификация и кластеризация
- Прогнозирование и визуализация
- Ассоциативные правила и обнаружение аномалий
- Методология CRISP-DM, SEMMA
- Инструменты Data Mining
- Специфика применения Data Mining для разных отраслей бизнеса с примерами
-
Машинное обучение для Data mining
- Основные определения
- Задачи и область применения машинного обучения
- Supervised/unsupervised машинное обучение
- Инструменты и технологии машинного обучения
-
Data mining в социальных сетях
- Введение в анализ социальных сетей и теорию графов
- Базовые алгоритмы на графах и основные возможности графового анализа
- Феномен маленького мира
- Выделение важных узлов в социальных сетях
- Инструменты и методы визуализации графов для применения в бизнесе
-
Инструментарий для работы с Big Data
- Специфика работы с Big Data
- Аналитика для неструктурированных данных с использованием Hadoop
- Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive, и т.д.)
- Сравнительный анализ Hadoop дистрибутивов (Аренадата Hadoop, Cloudera, Horton Works, MapR) и инструментарий аналитика данных на примерах использования
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data
- Облачные платформы (AWS, EMR, Azure) для реализации решений по Big Data
- Средства визуализации для аналитики данных.
- Интеграция Больших данных
-
Правовые аспекты организации защиты персональных данных
- Правовое регулирование в области защиты персональных данных
- Международная практика в области защиты персональных данных
- Права субъекта и обязанности оператора при обработке персональных данных
- Виды нарушений безопасности персональных данных
- Стандарт GDRP
-
С чего начать?
- Формирование команды проекта Big Data. Ключевые роли
- Специфика рынка данных и аналитики
- Использование подходов Agile и DevOps
- Методологии для стандарты
- Отличия подходов Business Intelligence и Data Science
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.