- Курс
- Место
Курс Основы Hadoop содержит базовые сведения по установке и настройке кластера Hadoop, выполнению основных операций в файловой системе HDFS, запуска задач MapReduce, основам управления ресурсами Hadoop с помощью планировщика задач YARN и знакомит слушателей с концепциями использования Hadoop и компонент экосистемы Hadoop (MapReduce, Apache Hive, Apache Pig, Apache Flume, Apache Sqoop и Apache Spark) для организации хранения больших данных и процессинга.
Курс построен на сквозных практических примерах с тренировочными наборами данных, для запуска batch и потоковых (streaming) задач в Hadoop кластере. Индивидуальные кластера Hadoop для каждого слушателя в облачной инфраструктуре Amazon Web Services, что позволяет закрепить все концепции и понятия на практических заданиях с использованием выбранного слушателем дистрибутива (Cloudera Distributed Hadoop, HortonWorks HDP или ArenaDataHadoop) и познакомиться с выбранным программным обеспечением по управлению кластером Cloudera Manager или Apache Ambari на выбор.