dkrotx / hadoop_sem2

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Второй семинар по курсу Hadoop

Демонстрация работы вторичной сортировки в Hadoop. Используем открытые данные метеостанций для нахождения максимумов температур за год.

Сборка и запуск

Для всей демонстрации достаточно запустить ./run.sh
Основной исходный файл: src/main/java/SecondarySortDemo.java

Визуализация

Используйте полученный файл temps.kml в http://www.gpsvisualizer.com/

About


Languages

Language:Java 86.8%Language:Python 8.2%Language:Shell 4.9%