Конференция Al&BigData Lab

12 April 2014 (Sat), 09:00 - 18:30

ул. Греческая 1а

Price: 250 грн.

Время	Поток 1	Поток 2
9.00 - 9.50	Регистрация
9.50 - 10.00	Открытие
10.00 - 11.00	"Natural Language Processing на практике"(Всеволод Демкин, Grammarly) Natural Language Processing — область на пересечении практической програмной инженерии и компьютерных наук (алгоритмов, машинного обучения и статистики). Она включает множество различных задач и, соответсвенно, подходов и методов их решения. Ключевым фактором успеха любого NLP проекта являются качественные данные, поэтому в первую очередь мы поговорим о том, где их брать и как с ним работать. Далее идут различные модели и алгоритмы. Мы бегло рассмотрим основные инструменты (от теоремы Байеса до глубинных нейросетей), которые используются в NLP и обсудим, в каких условиях какие предпочтительнее. В отличие от обычной программной инженерии, в NLP большая часть времени и усилий уходит не на написание программы, а на эксперименты. Это специфический вид дейтельности, который требует своих подходов — и мы обсудим их. Наконец, мы посмотрим , как собрать все это в единое целое и получить готовый продукт на примере решения задачи из реального мира, используя публично доступные данные.	"Data Mining и информационный поиск: проблемы, алгоритмы, решения" (Александр Краковецкий, DevRain Solutions) Каждый день мы пользуемся поисковыми системами - Google, Bing, Яндекс и другими. Современные поисковые системы дают достаточно точные результаты, но, тем не менее, не лишены недостатков. В то время, когда количество информации увеличивается каждый год в геометрической прогрессии, даже небольшие улучшения в работе поисковых механизмов могут значительно сократить всемя сбора, анализа и поиска информации, а также сэкононить время пользователей. В докладе пойдет речь о проблемах информационного поиска - дублирующейся информации, огромном количестве информационного мусора, большого времени на поиск "нетривиальных" данных. Доклад не будет посвящен какой-то конкретной области Data Mining или алгоритму, а будет касаться сразу нескольких областей из области Text Mining, кластеризации, NLP, SEO для решения конкретной задачи - уменьшения времени поиска необходимой информации. Кроме того, вы узнаете как работает сервисы а-ля Readability, и как они могут улучшить поисковые алгоритмы.
11.00 - 11.15	Кофе-брейк
11.15 - 12.15	"DeepLearning: сложный анализ данных простыми словами" (Сергей Шелпук, SoftServe) Количество данных растет огромными темпами, и человечество не имеет достаточно ресурсов, чтобы маркировать и обрабатывать эти данные перед анализом. В связи с этим алгоритмы, работающие с немаркированными данными (unsupervisedlearning), выходят на первое место по потенциалу для практического применения. Deeplearning нейронные сети - один из самых мощных алгоритмов анализа немаркированных данных на сегодняшний день. Основанный на концепции работы мозга и идее единого обучающего алгоритма, этот подход показывает лучшие результаты на большом спектре проблем анализа данных: анализ видео, изображений, звука, текста и другие. Создание deeplearningнейронных сетей требует интуитивного понимания принципов их работы, равно как и больших вычислительных мощностей. Параллельные вычисления на GPU– один из способов получить эти мощности. Обучение deeplearningнейронных сетей на GPU на сегодняшний день является наиболее эффективным и дешевым способом работы с ними. Этот доклад будет посвящен объяснению принципов работы deeplearningсетей простыми словами, алгоритмическим приемам, делающим это обучение эффективным, и технологическим инструментам, позволяющим строить сети самым быстрым и дешевым способом.	"Тема уточняется"
12.15 - 12.30	Кофе-брейк
12.30 - 13.00	"Что такое визуализация данных, или почему специалисты, работающие с данными, должны быть немного художниками" (Владимир Тимашов, DataArt) Веками человечество накапливает информацию, и Big Data увеличил объемы полезных сведений в миллионы раз. Сами по себе сырые данные бесполезны, и у нас постоянно возникает проблема представить эти данные конечному пользователю, увидеть тренды и ключевые моменты. И тут нам на помощь приходит визуализация данных, в умелых руках способная преобразить данные и представить в выгодном свете. В докладе мы пробежимся по разным этапам визуализации. Посмотрим на подходы к визуальному представлению информации. Затронем технические решения, доступные сегодня и для кастомной разработки (d3.js, Raphael, Three.js), и готовые Enterprise-продукты (Tableau, QlikView). Посмотрим на применение визуализации в реальных проектах — сделанных и в DataArt, и мировыми лидерами в этой сфере.	"AI&BigData для путешественников" (Кузнецов Юрий, Senturia) Практика работы с большими данными в онлайн сервисе. Задачи современного агентства путешествий. Обзор подходов к организации системы сервисов. Перспективы машинного обучения в индустрии.
13.00 - 13.30		"Методы распараллеливания и эффективных вычислений в языке R"(Владислав Колбасин, Aginity) Обзор приемов, методов и пакетов, позволяющих эффективно выполнять вычисления, а также распараллеливать выполнение R кода: - Стандартные функции и приемы правильного использования R. - Пакет data.table: возможности, синтаксис, примеры использования. - Обзор пакетов для анализа данных и машинного обучения, умеющих работать в параллельном режиме.
13.30 - 15.00	Обед
15.00 - 16.00	"Тема уточняется" (HP)	"Моделирование структурными уравнениями (Structural Equation Modeling) в среде R"(Алексей Гаевский) Моделирование структурными уравнениями. Обзор пакетов для моделирования структурными уравнениями. Пакет lavaan: возможности, синтаксис. Практическое применение: построение моделей, тонкая настройка параметров модели, обработка отсутствующих значений.
16.00 - 16.15	Кофе-брейк
16.15 - 18.15	Тема уточняется	Тема уточняется (Microsoft)
18.15 - 18.30	Закрытие

Hashtag

@geeks_labs

Event in socials

Official web-site

http://geekslab.co/events/bigdatalab

Contacts

Анастасия Слепцова

+38 (097) 654-01-78

m31@rootuamedia.com

Congratulations!

You've successfully subscribed for news.