lcscarpini / bigdata_docker

Big Data Ecosystem Docker

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

BIG DATA ECOSYSTEM COM DOCKER

Ambiente para estudo dos principais frameworks big data em docker.
Esse setup vai criar dockers com os frameworks HDFS, HBase, Hive, Presto, Spark, Jupyter, Hue, Mongodb, Metabase, Nifi, kafka, Mysql e Zookeeper com a seguinte arquitetura:

Ecossistema

SOFTWARES NECESSÁRIOS

Para a criação e uso do ambiente vamos utilizar git e docker

OBS: Existe um git na instação do Docker ToolBox, caso já tenha instalado não precisa instalar novamente

SETUP

OBS: Esse passo deve ser realizado apena uma vez. Após o ambiente criado, utilizar o docker-compose para iniciar os containers como mostrado no tópico INICIANDO O AMBIENTE

Criação do diretório docker:

OBS: A criação do diretório é importante para os mapeamentos necessários

  • No Windows:

    • Criar na raiz do seu drive o diretório docker ex: C:\docker
  • No Linux:

    • Criar o diretório na home do usuário ex: /home/user/docker

Em um terminal/DOS, dentro diretório docker, realizar o clone do projeto no github

      git clone https://github.com/fabiogjardim/bigdata_docker.git

No diretório bigdata_docker vai existir os seguintes objetos

ls

  • No Windows:

    Abrir o Docker Quickstart Terminal, isso fará com que a VM default seja criada no VirtualBox ls

    No DOS, dentro do diretório bigdata_docker, renomear o arquivo docker-compose_windows.yml para docker-compose.yml

      move docker-compose_windows.yml docker-compose.yml
    

    Executar o arquivo virtualbox_config.bat
    O arquivo bat cria/reacria a VM default com disco de até 100GB, 8GB de memória, drive do repo compartilhado como /d e todas as portas necessárias mapeadas

    OBS: se o ser driver raiz for diferente de C:, alterar o arquivo virutalbox_config.bat na parte indicada no comentário. A memória também pode ser alterada no local indicado.

    ls

  • No Linux: Não é necessário alterar nem executar nada

INICIANDO O AMBIENTE

No Windows abrir o Docker Quickstart Terminal, do Linux um terminal

No terminal, no diretorio bigdata_docker, executar o docker-compose

      docker-compose up -d        

Verificar imagens e containers

     docker image ls

docker image ls

     docker container ls

docker container

SOLUCIONANDO PROBLEMAS

No Windows abrir o Docker Quickstart Terminal

Parar um containers

     docker stop [nome do container]      

Parar todos containers

     docker stop $(docker ps -a -q)

Remover um container

     docker rm [nome do container]

Remover todos containers

     docker rm $(docker ps -a -q)         

Dados do containers

     docker container inspect [nome do container]

Iniciar um container

     docker-compose up -d [nome do container]

Iniciar todos os containers

     docker-compose up -d 

Acessar log do container

     docker container logs [nome do container] 

Acesso WebUI dos Frameworks

Acesso por shell

HDFS
      docker exec -it datanode bash
HBase
      docker exec -it hbase-master bash
Sqoop
      docker exec -it datanode bash
Kafka
      docker exec -it kafka bash

Acesso JDBC

MySQL
      jdbc:mysql://database/employees
Hive
      jdbc:hive2://hive-server:10000/default
Presto
      jdbc:presto://presto:8080/hive/default

Usuários e senhas

Hue
Usuário: admin
Senha: admin
Metabase
Usuário: bigdata@class.com
Senha: bigdata123 
MySQL
Usuário: root
Senha: secret
MongoDB
Usuário: root
Senha: root
Authentication Database: admin

Imagens

Docker Hub

Documentação Oficial

About

Big Data Ecosystem Docker


Languages

Language:VBA 89.6%Language:Jupyter Notebook 9.5%Language:Batchfile 0.8%Language:PLSQL 0.2%