PDimitryuk / bigdata-docker-compose

(Почти) настроенный докер с последним хадупом и сопутствующими инструментами на борту

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

bigdata-docker-compose

(Почти) настроенный докер с последним hadoop и сопутствующими инструментами на борту

Образ при сборке выкачивает много данных (ставит хадупы\юпитеры\хайвы и т.д.). Это норма. Лучше не запускаться при подключении к лимитному интернету.

Для запуска:

  1. Поставить docker + docker-compose на локальную машину

Для запуска hadoop:

  1. Сначала запускаем неймноду с командой command: ["hdfs", "namenode", "-format", "-force"]
  2. Так запуститься надо только в первый раз (либо, после того, как вы снесли образ и примонтированный раздел)
  3. После того, как контейнер отработал и завершился, запускаемся с командой command: ["hdfs", "namenode"]
  4. После неймноды поднимаем датаноды, нодменеджеры и т.д.

Для запуска hive:

  1. Сначала поднимаем постгрес.
  2. Затем поднимаем метастор с командой command: ["schematool", "--dbType", "postgres", "--initSchema"]
  3. Так запуститься надо только в первый раз (либо, после того, как вы снесли образ и примонтированный раздел)
  4. После того, как контейнер отработал и завершился, запускаемся с командой command: [ "hive", "--service", "metastore" ]
  5. После метастора запускаем hiveserver2

About

(Почти) настроенный докер с последним хадупом и сопутствующими инструментами на борту


Languages

Language:Jupyter Notebook 80.7%Language:Shell 14.3%Language:Batchfile 3.4%Language:Dockerfile 1.0%Language:XSLT 0.6%