- Сourse
Интенсив - это компактная, но предельно насыщенная онлайн-активность, адресованная новичкам и предназначенная для быстрого погружения в конкретную технологию.
Какие перспективы открывают навыки работы с HDFS
На интенсиве вы узнаете о среде для работы с большими данными - Apache Hadoop, а также научитесь работать с основополагающим компонентом фреймворка Apache Hadoop: HDFS
Hadoop Distributed File System (HDFS) – распределённая файловая система, позволяющая хранить информацию практически неограниченного объёма. HDFS является неотъемлемой частью экосистемы Hadoop, куда входят фреймворки Spark, Hive, HBase и другие. Hadoop Distributed File System активно используют и другие направления Big Data, включая подготовку и анализ данных, а также аналитические системы на базе алгоритмов машинного обучения (Machine Learning).
После интенсива вы будете:
▶ понимать, зачем нужны большие данные (Big Data)
▶ разбираться, как устроена HDFS, ее составляющие
▶ знать преимущества и недостатки HDFS
▶ уметь записывать и читать данные в/из HDFS
▶ исследовать файловую систему HDFS с точки зрения системного администратора