- Конференция
- Программа
- Место
Время |
Поток 1 |
Поток 2 |
9.00 - 9.50 |
Регистрация |
|
9.50 - 10.00 |
Открытие |
|
10.00 - 11.00 |
"Natural Language Processing на практике" (Всеволод Демкин, Grammarly) Natural Language Processing — область на пересечении практической програмной инженерии и компьютерных наук (алгоритмов, машинного обучения и статистики). Она включает множество различных задач и, соответсвенно, подходов и методов их решения. Ключевым фактором успеха любого NLP проекта являются качественные данные, поэтому в первую очередь мы поговорим о том, где их брать и как с ним работать. Далее идут различные модели и алгоритмы. Мы бегло рассмотрим основные инструменты (от теоремы Байеса до глубинных нейросетей), которые используются в NLP и обсудим, в каких условиях какие предпочтительнее. В отличие от обычной программной инженерии, в NLP большая часть времени и усилий уходит не на написание программы, а на эксперименты. Это специфический вид дейтельности, который требует своих подходов — и мы обсудим их. Наконец, мы посмотрим , как собрать все это в единое целое и получить готовый продукт на примере решения задачи из реального мира, используя публично доступные данные. |
"Data Mining и информационный поиск: проблемы, алгоритмы, решения" (Александр Краковецкий, DevRain Solutions) Каждый день мы пользуемся поисковыми системами - Google, Bing, Яндекс и другими. Современные поисковые системы дают достаточно точные результаты, но, тем не менее, не лишены недостатков. В то время, когда количество информации увеличивается каждый год в геометрической прогрессии, даже небольшие улучшения в работе поисковых механизмов могут значительно сократить всемя сбора, анализа и поиска информации, а также сэкононить время пользователей. В докладе пойдет речь о проблемах информационного поиска - дублирующейся информации, огромном количестве информационного мусора, большого времени на поиск "нетривиальных" данных. Доклад не будет посвящен какой-то конкретной области Data Mining или алгоритму, а будет касаться сразу нескольких областей из области Text Mining, кластеризации, NLP, SEO для решения конкретной задачи - уменьшения времени поиска необходимой информации. Кроме того, вы узнаете как работает сервисы а-ля Readability, и как они могут улучшить поисковые алгоритмы. |
11.00 - 11.15 |
Кофе-брейк |
|
11.15 - 12.15 |
"DeepLearning: сложный анализ данных простыми словами" (Сергей Шелпук, SoftServe) Количество данных растет огромными темпами, и человечество не имеет достаточно ресурсов, чтобы маркировать и обрабатывать эти данные перед анализом. В связи с этим алгоритмы, работающие с немаркированными данными (unsupervisedlearning), выходят на первое место по потенциалу для практического применения. Deeplearning нейронные сети - один из самых мощных алгоритмов анализа немаркированных данных на сегодняшний день. Основанный на концепции работы мозга и идее единого обучающего алгоритма, этот подход показывает лучшие результаты на большом спектре проблем анализа данных: анализ видео, изображений, звука, текста и другие. Создание deeplearningнейронных сетей требует интуитивного понимания принципов их работы, равно как и больших вычислительных мощностей. Параллельные вычисления на GPU– один из способов получить эти мощности. Обучение deeplearningнейронных сетей на GPU на сегодняшний день является наиболее эффективным и дешевым способом работы с ними. Этот доклад будет посвящен объяснению принципов работы deeplearningсетей простыми словами, алгоритмическим приемам, делающим это обучение эффективным, и технологическим инструментам, позволяющим строить сети самым быстрым и дешевым способом. |
Доклад 2 |
12.15 - 12.30 |
Кофе-брейк |
|
12.30 - 13.00 |
"Тема уточняется" (DataArt) |
"Тема уточняется" (Senturia) |
13.00 - 13.30 |
"Методы распараллеливания и эффективных вычислений в языке R" (Владислав Колбасин, Aginity) Описание уточняется |
|
13.30 - 15.00 |
Обед |
|
15.00 - 16.00 |
"Тема уточняется" (HP) |
"Моделирование структурными уравнениями (Structural Equation Modeling) в среде R" (Алексей Гаевский) Моделирование структурными уравнениями. Обзор пакетов для моделирования структурными уравнениями. Пакет lavaan: возможности, синтаксис. Практическое применение: построение моделей, тонкая настройка параметров модели, обработка отсутствующих значений. |
16.00 - 16.15 |
Кофе-брейк |
|
16.15 - 18.15 |
Воркшоп "Распознаем движения человека используя R" Вы познакомитесь с основами анилиза данных и машинного обучения, предсказывая состояние человека по данным со смартфона. Содержание: - Установка R и R-Studio Что взять с собой? Ноутбук, желательно с предустановленным R и R-Studio |
Воркшоп "Тема уточняется" Воркшоп посвящен MapReduce, обработке больших данных в облаке с помощью no-SQL БД и платформе Hadoop |
18.15 - 18.30 |
Закрытие |