- Conference
- Program
- Price
- Location
Время |
Поток 1 |
Поток 2 |
9.00 - 9.50 |
Регистрация |
|
9.50 - 10.00 |
Открытие |
|
10.00 - 11.00 |
"Natural Language Processing на практике"(Всеволод Демкин, Grammarly) Natural Language Processing — область на пересечении практической програмной инженерии и компьютерных наук (алгоритмов, машинного обучения и статистики). Она включает множество различных задач и, соответсвенно, подходов и методов их решения. Ключевым фактором успеха любого NLP проекта являются качественные данные, поэтому в первую очередь мы поговорим о том, где их брать и как с ним работать. Далее идут различные модели и алгоритмы. Мы бегло рассмотрим основные инструменты (от теоремы Байеса до глубинных нейросетей), которые используются в NLP и обсудим, в каких условиях какие предпочтительнее. В отличие от обычной программной инженерии, в NLP большая часть времени и усилий уходит не на написание программы, а на эксперименты. Это специфический вид дейтельности, который требует своих подходов — и мы обсудим их. Наконец, мы посмотрим , как собрать все это в единое целое и получить готовый продукт на примере решения задачи из реального мира, используя публично доступные данные. |
"Data Mining и информационный поиск: проблемы, алгоритмы, решения" (Александр Краковецкий, DevRain Solutions) Каждый день мы пользуемся поисковыми системами - Google, Bing, Яндекс и другими. Современные поисковые системы дают достаточно точные результаты, но, тем не менее, не лишены недостатков. В то время, когда количество информации увеличивается каждый год в геометрической прогрессии, даже небольшие улучшения в работе поисковых механизмов могут значительно сократить всемя сбора, анализа и поиска информации, а также сэкононить время пользователей. В докладе пойдет речь о проблемах информационного поиска - дублирующейся информации, огромном количестве информационного мусора, большого времени на поиск "нетривиальных" данных. Доклад не будет посвящен какой-то конкретной области Data Mining или алгоритму, а будет касаться сразу нескольких областей из области Text Mining, кластеризации, NLP, SEO для решения конкретной задачи - уменьшения времени поиска необходимой информации. Кроме того, вы узнаете как работает сервисы а-ля Readability, и как они могут улучшить поисковые алгоритмы. |
11.00 - 11.15 |
Кофе-брейк |
|
11.15 - 12.15 |
"DeepLearning: сложный анализ данных простыми словами" (Сергей Шелпук, SoftServe) Количество данных растет огромными темпами, и человечество не имеет достаточно ресурсов, чтобы маркировать и обрабатывать эти данные перед анализом. В связи с этим алгоритмы, работающие с немаркированными данными (unsupervisedlearning), выходят на первое место по потенциалу для практического применения. Deeplearning нейронные сети - один из самых мощных алгоритмов анализа немаркированных данных на сегодняшний день. Основанный на концепции работы мозга и идее единого обучающего алгоритма, этот подход показывает лучшие результаты на большом спектре проблем анализа данных: анализ видео, изображений, звука, текста и другие. Создание deeplearningнейронных сетей требует интуитивного понимания принципов их работы, равно как и больших вычислительных мощностей. Параллельные вычисления на GPU– один из способов получить эти мощности. Обучение deeplearningнейронных сетей на GPU на сегодняшний день является наиболее эффективным и дешевым способом работы с ними. Этот доклад будет посвящен объяснению принципов работы deeplearningсетей простыми словами, алгоритмическим приемам, делающим это обучение эффективным, и технологическим инструментам, позволяющим строить сети самым быстрым и дешевым способом. |
"Тема уточняется" |
12.15 - 12.30 |
Кофе-брейк |
|
12.30 - 13.00 |
"Что такое визуализация данных, или почему специалисты, работающие с данными, должны быть немного художниками" (Владимир Тимашов, DataArt) Веками человечество накапливает информацию, и Big Data увеличил объемы полезных сведений в миллионы раз. Сами по себе сырые данные бесполезны, и у нас постоянно возникает проблема представить эти данные конечному пользователю, увидеть тренды и ключевые моменты. И тут нам на помощь приходит визуализация данных, в умелых руках способная преобразить данные и представить в выгодном свете. В докладе мы пробежимся по разным этапам визуализации. Посмотрим на подходы к визуальному представлению информации. Затронем технические решения, доступные сегодня и для кастомной разработки (d3.js, Raphael, Three.js), и готовые Enterprise-продукты (Tableau, QlikView). Посмотрим на применение визуализации в реальных проектах — сделанных и в DataArt, и мировыми лидерами в этой сфере. |
"AI&BigData для путешественников" (Кузнецов Юрий, Senturia) Практика работы с большими данными в онлайн сервисе. Задачи современного агентства путешествий. Обзор подходов к организации системы сервисов. Перспективы машинного обучения в индустрии. |
13.00 - 13.30 |
"Методы распараллеливания и эффективных вычислений в языке R"(Владислав Колбасин, Aginity) Обзор приемов, методов и пакетов, позволяющих эффективно выполнять вычисления, а также распараллеливать выполнение R кода: - Стандартные функции и приемы правильного использования R. |
|
13.30 - 15.00 |
Обед |
|
15.00 - 16.00 |
"Тема уточняется" (HP) |
"Моделирование структурными уравнениями (Structural Equation Modeling) в среде R"(Алексей Гаевский) Моделирование структурными уравнениями. Обзор пакетов для моделирования структурными уравнениями. Пакет lavaan: возможности, синтаксис. Практическое применение: построение моделей, тонкая настройка параметров модели, обработка отсутствующих значений. |
16.00 - 16.15 |
Кофе-брейк |
|
16.15 - 18.15 |
Тема уточняется |
Тема уточняется (Microsoft) |
18.15 - 18.30 |
Закрытие |