- Lecture
- Location
Будет рассказано о возможностях обработки больших объемов данных с использованием различных реализаций Map-Reduce.
· что вообще такое Map-Reduce и какие задачи им можно решать;
· как быстро запрототипировать Map-Reduce и проверить работоспособность программы на своем лаптопе;
· как развернуть свой небольшой кластер на нескольких машинах;
· что делать, если своих вычислительных мощностей не хватает;
Будет не очень много слайдов и ощутимое количество кода на Python и Java. Экспертных знаний этих языков не требуется, но будет прекрасно, если слушатели будут понимать основные конструкции.
Лектор:
Дмитрий Барашев, доцент кафедры информатики математико-механического факультета СПбГУ. В течении последних шести лет занимался обработкой больших объемов данных для разных приложений в Google.