Курс дает представление об основах колоночной системы управления базами данных Apache HBase и методах разработки приложений, обрабатывающих данные на ее основе.
HBase создана по мотивам архитектуры Google Big Table и представляет собой нереляционную колоночно-ориентированную распределенную NoSQL базу данных, использующую для хранения данных распределенную надежную файловую систему HDFS.
HBase обеспечивает автоматическое секционирование данных, балансировку нагрузки, кэширование, репликацию, сжатие, быстрое чтение данных и сильную согласованность.
Программа:
- Основные принципы и экосистема;
- Модель данных: физическое хранилище, семейства столбцов, версии строк, логическое хранилище;
- Архитектура: компоненты кластера, регионы, уплотнение, переключение при сбоях;
- Проектирование схем данных;
- Программный интерфейс для Java;
- Примеры: OLTP, MDM, хранилище документов, обработка событий.