Для кого эта лекция: вы работаете в ИТ и периодически сталкиваетесь с необходимостью разработки «интеллектуальных» алгоритмов для анализа видео- или аудиосигналов (текстов, пользовательской активности в сети или на рынке, ... ), пытаетесь для самообразования читать научно-популярные статьи о машинном обучении из Википедии, возможно даже прослушали курс с соответствующим названием на coursera.com. Но вы чувствуете, что вам не хватает обобщающего взгляда на проблемы распознавания образов, хотелось бы научиться выбирать методы, подходящие для решения ваших задач и научиться пользоваться этими методами более осмысленно, чем в режиме чёрного ящика.
Что нужно знать для того, чтобы понять лекцию: основы математики и элементарной теории вероятности. Нужно не пугаться арифметических действий типа сложения и умножения и иметь элементарное представление о геометрических фигурах вроде прямых, эллипсов и многогранников.
План мастер-класса:
1. Вступление: постановка целей на лекцию, ее план.
Научить распознаванию образов за день я не смогу - как и не смог бы научить математике за день. Дам общие принципы поиска и оценивания того, что уже существует, для решения ваших потенциальных задач
2. Пример прикладной задачи и ее анализ.
Распознавание человеческих лиц: от дверного замка в офисе и анализа новостных видеопотоков до поиска по базе данных на основании скрытой съёмки с веб-камеры. Этот пример составит фундамент нашей лекции.
3. Модель.
Оказывается, если модель очень хороша, то простейшее решение — наиболее вероятное оценивание — работает очень неплохо, т.к. остальные вероятности просто близки к нулю.
Обсудим такие популярности, как нейронные сети, методы опорных векторов, марковские случайные поля, графические модели и пр. Попробуем на простых примерах понять, как и когда наши модели отображают действительность, а когда нет.
4. Алгоритм.
Сюда я отнёс не только сам алгоритм, но и математическую постановку задачи, для решения которой он предназначен. Мы уже кое-что узнали о правильных постановках, теперь поговорим о том, какие алгоритмы и чем хороши/плохи.
5. Наблюдения (входные данные) и инженерное упрощение задачи.
Как и какие (технические) средства применить, чтобы упростить задачу.
6. Заключение: осознанный выбор метода распознавания.
Докладчик:
Савчинский Богдан
Работает в области распознавания изображений с 1999 года. Сначала — научным сотрудником киевского Института кибернетики, последнее время — в Германии, в университете г. Хайдельберга. Преподавал в киевском политехе и в хайдельбергском университете. Помимо прочего руководил проектом по созданию 3D моделей городских кварталов по их карте и базе данных изображений.