masreis / cloudera-administrator-training

Scripts e apresentações para o curso de Cloudera Administrator

Home Page:http://marcoreis.net

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

cloudera-administrator-training

Scripts e apresentações para o curso de Cloudera Administrator.

Configuração do cluster com o Cloudera Manager.

Sistemas de Big Data

  1. ETL
  2. Análise de dados
  3. Machine Learning
  4. Text Mining
  5. Gerenciamento de APIs
  6. Análise de dados não estruturados
  7. NoSQL

Pré-requisitos

  1. Linux (Ubuntu)
  2. Rede
  3. SQL
  4. Java/JVM (opcional)
  5. Criatividade

Softwares utilizados

  1. Ubuntu 16.04 Server
  2. Cloudera 5.15

Ecossistema Hadoop

  1. Hadoop (CDH)
  2. HDFS
  3. YARN
  4. Flume
  5. Hive
  6. Impala
  7. Hue
  8. Oozie
  9. ZooKeeper
  10. Sentry
  11. Sqoop

Modos de processamento

  1. Batch
  2. Streaming
  3. Modelo híbrido

About

Scripts e apresentações para o curso de Cloudera Administrator

http://marcoreis.net


Languages

Language:Shell 100.0%