- Митап
- Место
25 декабря приглашаем на рождественскую Data Ёлку в 2ГИС подвести итоги года.
В программе четыре доклада от активных участников сообщества Open Data Science Siberia и неформальное общение.
Программа
16:00 — 16:10 Приветственное слово
16:10 — 16:50 Машинное обучение в ЦФТ: чему научились за год // Иван Комаров
В докладе кратко подведу итоги года, а год выдался обильным на ДС события: 1. Началось с обучения бизнесу — есть ли толк? 2. Далее учились сами — неужели что-то не знали? 3. Пришли новые люди — а ушли ли старые? 4. Начали ДатаФест — зачем это нужно? 5. Провели конкурс — готовим следующий?
16:50 — 17:30 Поиск дубликатов товаров в 2ГИС // Александр Радионов
В докладе рассказывается как при помощи NLP и ML была решена проблема поиска одинаковых описаний товаров среди миллионов товарных предложений разных магазинов. Как правильно подготовить Dataset? Возможно ли использовать синтетические данные и насколько они эффективны? Как выйти в продакшн — проблемы масштабирования (50+ серверов)
17:30 — 18:00 Кофебрейк
18:00 — 18:40 ELMo — умные эмбеддинги для понимания текстов // Иван Бондаренко
1. Краткое введение — что такое эмбеддинги и зачем они нужны в Natural Language Processing/Understanding 2. Языковые модели на нейронных сетях. Казалось бы, причём здесь эмбеддинги? 3. ELMo — умные эмбеддинги из рекуррентных нейросетевых языковых моделей, умеющие в контекст («коса», «коса» и «коса» — теперь между ними есть разница!). 4. А какая нам с этого польза? (ELMo для русского языка и результаты экспериментов с NER на очень маленьком датасете)
18:40 — 19:20 Развитие CS центра. Запуск ML-тренировок в НГУ // Александр Авдюшенко
Подведу некоторые итоги пятилетки развития ШАД в Новосибирске и немного расскажу о дальнейших планах. 1. Что привнёс CS центр в наш филиал ШАД 2. Как мы пытаемся влиять на IT образование в НГУ 3. ML-тренировки: успехи и неудачи 4. Помечтаем о будущем образования: обучение через проекты, дистанционное обучение, эффективное обучение лично тебе =)
19:20 — 22:00 Свободное общение