Блок 1: Введение в Data Science и Machine Learning
- Что такое Data Science и машинное обучение
- Типовые задачи, которые можно решать с помощью машинного обучения
- Что такое большие данные и какие ценности они несут для организаций
- Data Driven подход для развития бизнеса
- Существующие стандарты и практики DS проектов
- Наиболее яркие и значимые примеры применения Data Science проектов
- Обзор успешных проектов по Big Data и Machine Learning в Украине и за рубежом
Блок 2: Бизнес анализ в проектах машинного обучения
- Детальный обзор современного Data Science процесса и его этапов
- Обзор и понимание основных терминов Data Science
- Основы машинного обучения и типы решаемых задач
- Выполнение этапа бизнес анализа в проектах машинного обучения
- Особенности бизнес анализа для Data Science проектов
- Новые сложности DS проектов и пути их преодоления
- Workshop: Бизнес анализ и рекомендация решения c применением технологий Data Science и Machine Learning
- Этап исследования данных
- Сложности, связанные с этапом Data Understanding
- Структуры данных и артефакты для перехода к началу проекта
- Workshop: Выполнение этапа Исследование данных для DSML проекта
Блок 3: Начальная подготовка данных
- Основы понимания наборов данных, feature и целевых переменных
- Импорт и объединение данных
- Работы с некачественными данными
- Инструменты для обработки данных
- Workshop: Импорт и предварительная обработка данных
Блок 4. Визуализация данных
- Походы и методики для визуализации данных
- История визуализации, примеры лучших кейсов
- Типичные ошибки при визуализации
- Лучшие практики и руководства при проектировании визуализации
- Что такое Data Storytelling и зачем этот навык
- Обзор инструментов для визуализации
- Инструмент Power BI для визуализации данных
- Продвинутые методы визуализации
- Workshop 1: Визуализация данных с помощью Power BI и R
Блок 5: Решение задач с учителем
- Типы решаемых задач
- Общий подход для выполнения Supervised Learning
- Задачи регрессии и алгоритмы для их решения
- Задачи классификации и алгоритмы для их решения
- Оценка полученных моделей в задачах регрессии и классификации
- Статистические метрики для оценивания задач с учителем
- Визуализация качества работы модели
- Workshop 2: Решение задачи регрессии на примере определения стоимости
- Workshop 3: Решение задачи классификации на примере Employee / Customer Churn Rate Prediction
Блок 6: Решение задач машинного обучения без учителя
- Обзор проблематики и типы решаемых задач в Unsupervised Machine Learning
- Разбор принципов работы популярных алгоритмов кластеризации
- Алгоритмы, подходы и сложности решения решения задач кластеризации
- Построение рекомендательных систем
- Решение задач мошенничества и нетипичного поведения
- Workshop 4: Модель решения задачи кластеризации
Блок 7: Имплементация моделей машинного обучения
- Типовые архитектуры проектов Data Science
- Деплоймент моделей машинного обучения для дальнейшего использования
- Управление проектами Data Science и применение Agile практик
- Workshop 5: Публикация модели в виде рабочего продукта
- Ресурсы с готовыми наборами данных
- Ресурсы с готовыми решениями
- Ресурсы для самостоятельного развития
Official web-site
https://www.artofba.com/data-science-for-business-analyst