Практическая работа «MapReduce»

Цель работы

Проверить работу платформы MapReduce.

Ход работы

Подключиться к кластеру по протоколу SSH.

получить у преподавателя логин, ключ и адрес кластера
использовать клиент ssh (OpenSSH или PuTTY) для подключения к кластеру
после подключения определить
- имя компьютера (команда hostname)
- тип процессора (команда head /proc/cpuinfo)
- объем ОЗУ (команда free -h)
- объем файловых систем (команда df -h)
сделать скриншот

Подключиться к веб-интерфейсу HDFS и YARN

настроить динамический перенаправление TCP-портов в подключении SSH
настроить в браузере использование прокси SOCKS5
открыть в браузере веб-интерфейс HDFS
найти браузер файлов и сделать скриншот
открыть в браузере веб-интерфейс YARN
найти перечень заданий и сделать скриншот

Подготовить данные

через интерфейс командной строки:

создать каталог для входных данных (mkdir <имя каталога>)
создать текстовый файл (nano <имя файла>) и добавить в него текст
загрузить каталог в HDFS (hadoop fs -put <имя каталога> <путь в HDFS>)
сделать скриншот команды и её результата

Скомпилировать исходный код примера

создать файл с исходным кодом (см. Литературу)
скомпилировать исходный код
сделать скриншот команды и её результата
запустить задание
сделать скриншот команды и её результата
сделать скриншот переченя заданий в веб-интерфейса YARN
отобразить результат на экран (hadoop fs -cat <имя файла с результатом>)
сделать скриншот команды и её результата

Литература