cloudera

There are 5 repositories under cloudera topic.

HariSekhon / DevOps-Bash-tools
1000+ DevOps Bash Scripts - AWS, GCP, Kubernetes, Docker, CI/CD, APIs, SQL, PostgreSQL, MySQL, Hive, Impala, Kafka, Hadoop, Jenkins, GitHub, GitLab, BitBucket, Azure DevOps, TeamCity, Spotify, MP3, LDAP, Code/Build Linting, pkg mgmt for Linux, Mac, Python, Perl, Ruby, NodeJS, Golang, Advanced dotfiles: .bashrc, .vimrc, .gitconfig, .screenrc, tmux..
bash docker perl cloudera hadoop kafka postgresql mysql devops jenkins aws gcp api kubernetes github git linux ci terraform hacktoberfest
Language:Shell 2667
OryxProject / oryx
Oryx 2: Lambda architecture on Apache Spark, Apache Kafka for real-time large scale machine learning
apache-kafka apache-spark cloudera java kafka lambda-architecture machine-learning oryx
Language:Java 1787
HariSekhon / Nagios-Plugins
450+ AWS, Hadoop, Cloud, Kafka, Docker, Elasticsearch, RabbitMQ, Redis, HBase, Solr, Cassandra, ZooKeeper, HDFS, Yarn, Hive, Presto, Drill, Impala, Consul, Spark, Jenkins, Travis CI, Git, MySQL, Linux, DNS, Whois, SSL Certs, Yum Security Updates, Kubernetes, Cloudera etc...
nagios-plugins zookeeper hadoop hbase cloudera jenkins cassandra elasticsearch docker kafka solr redis rabbitmq consul kubernetes cloud mysql aws linux hacktoberfest
Language:Python 1126
cloudbreak
hortonworks / cloudbreak
CDP Public Cloud is an integrated analytics and data management platform deployed on cloud services. It offers broad data analytics and artificial intelligence functionality along with secure user access and data governance features.
big-data deployment cloud java hadoop cloudera hacktoberfest
Language:Java 353
timveil / hive-jdbc-uber-jar
Hive JDBC "uber" or "standalone" jar based on the latest Apache Hive version
hive jdbc driver hortonworks hadoop kerberos cloudera apache
Language:Java 267
HariSekhon / HAProxy-configs
80+ HAProxy Configs for Hadoop, Big Data, NoSQL, Docker, Kubernetes, Elasticsearch, SolrCloud, HBase, MySQL, PostgreSQL, Apache Drill, Hive, Presto, Impala, Hue, ZooKeeper, SSH, RabbitMQ, Redis, Riak, Cloudera, OpenTSDB, InfluxDB, Prometheus, Kibana, Graphite, Rancher etc.
haproxy hadoop elasticsearch solrcloud hbase hive cassandra presto mysql postgresql zookeeper redis opentsdb influxdb prometheus mapr cloudera nosql apache-drill hacktoberfest
Language:Shell 235
Pushkr / Apache-Spark-Hands-On
Educational notes,Hands on problems w/ solutions for hadoop ecosystem
hive hadoop flume sqoop cloudera spark cca175 handson bigdata basics cheatsheet
Language:Python 86
AlionSSS / CDH-Install-Manual
CDH安装手册
hadoop install mannual cloudera cdh cm
84
teamclairvoyant / hadoop-deployment-bash
Code for the deployment of Hadoop clusters, written in Bourne or Bourne Again shell.
hadoop bash cloudera hortonworks
Language:Shell 34
data-platforms-tools
ryandawsonuk / data-platforms-tools
Guide to data platforms and tools
azure-synapse-analytics data-warehousing bigquery databricks snowflake data-platform cloudera data-mesh data-governance
31
san089 / Cloudera_Material
Cloudera_Material: Study Material to help people preparing for Cloudera CCA Spark and Hadoop Developer Exam (CCA175). Feel free to collaborate.
cca175 cloudera hadoop big-data bigdata hive sqoop spark flume certification cca pyspark sqoop-import sqoop-export sqoop-session hive-metastore
31
oracle-quickstart / oci-cloudera
Terraform module to deploy Cloudera on Oracle Cloud Infrastructure (OCI)
terraform oci cloud cloudera edh dsw cdh cdp hadoop spark partner-led oracle
Language:Python 20
teamclairvoyant / apache-airflow-cloudera-csd
CSD for Apache Airflow
cloudera csd airflow
Language:Shell 20
HariSekhon / lib
Perl Utility Library for my other repos
perl library hbase elasticsearch cassandra datastax mapr mongodb redis riak solr zookeeper cloudera cloudera-manager ambari biginsights hacktoberfest unit-test unit-testing unit-tests
Language:Perl 18
teamclairvoyant / apache-airflow-cloudera-parcel
Parcel for Apache Airflow
cloudera airflow parcel
Language:Dockerfile 17
ummmme / setup_cdh
CDH5.16.2 离线安装脚本
cloudera cdh cdh5 cdh-install
Language:Shell 17
cloudera / tutorial-assets
Assets used in Cloudera Tutorials
cloudera tutorials learning-by-doing
Language:Python 16
tspannhw / FLiPStackWeekly
FLaNK AI Weekly covering Apache NiFi, Apache Flink, Apache Kafka, Apache Spark, Apache Iceberg, Apache Ozone, Apache Pulsar, and more...
apacheflink apachekafka apachenifi apachespark cloudera lakehouse streaming timspann apacheiceberg
15
srowen / cdsw-simple-serving
Modeling Lifecycle with ACME Occupancy Detection and Cloudera
cloudera-data-science cloudera data-science workbench pmml openscoring
Language:Scala 14
cloudera / cdp-sdk-java
Cloudera CDP SDK for Java
cdp cdp-sdk cloudera
Language:Java 12
dmilan77 / cloudera-phoenix
CDH compliant Apache Phoenix
cloudera cloudera-phoenix cdh6 cdh cdh-phoenix phoenix
Language:Java 12
HuemulSolutions / huemul-bigdatagovernance
Huemul BigDataGovernance, es una framework que trabaja sobre Spark, Hive y HDFS. Permite la implementación de una estrategia corporativa de dato único, basada en buenas prácticas de Gobierno de Datos. Permite implementar tablas con control de Primary Key y Foreing Key al insertar y actualizar datos utilizando la librería, Validación de nulos, largos de textos, máximos/mínimos de números y fechas, valores únicos y valores por default. También permite clasificar los campos en aplicabilidad de derechos ARCO para facilitar la implementación de leyes de protección de datos tipo GDPR, identificar los niveles de seguridad y si se está aplicando algún tipo de encriptación. Adicionalmente permite agregar reglas de validación más complejas sobre la misma tabla.
bigdata spark-sql spark hive parquet data data-governance hadoop data-warehouse datamart dataquality data-engineering data-engineer cloudera hortonworks huemul-bigdatagovernance trabaja-sobre-spark chile huemul gdpr
Language:Scala 11
chezou / homebrew-cloudera
Homebrew Formulas for cloudera tools
cloudera homebrew
Language:Ruby 10
kongyew / greenplum-dockers
Create Greenplum docker files
greenplum dockers cloudera hortonworks postgres docker pxf minio
Language:Python 10
cloudera / cdpcli
CDP command line interface (CLI)
cdp cloudera
Language:Python 9
doc-genius-ai
thammuio / doc-genius-ai
DocGenius AI - Generative AI Chatbot for your Documents - Powered by Cloudera Machine Learning (CML)
genai genai-chatbot llm cloudera machine-learning cloudera-machine-learning cml
Language:Python 9
Sathiyarajan / big-data-pipeline
Big Data
hadoop spark kafka flume hive java scala hbase pig sqoop zookeeper hcatalog cloudera python windows-10 ubuntu1804
Language:Java 8
tspannhw / ClouderaFlowManagementWorkshop
Cloudera Flow Management Workshop with Apache NiFi
cloudera cfm apache-nifi nifi-registry
Language:Python 8
smartlin5228 / CCA175
cloudera-hadoop cloudera spark sparksql scala
Language:Java 7
cloudera / cdpcurl
Curl like tool with CDP request signing.
cdp cloudera
Language:Python 6
NFPA / LocationTools
Geocoding and Reverse Geocoding at Scale
geocoding geolocation spatial-data libpostal lucene cloudera
Language:Java 6
Powerspace / kudu-from-avro
A small Command Line tool to create an Kudu table from an Avro schema or from SQL script
kudu avro impala sql cloudera
Language:Scala 6
ptobarra / Business-Intelligence-on-Big-Data-_-U-TAD-2017-Big-Data-Master-Final-Project
This is the final project I had to do to finish my Big Data Expert Program in U-TAD in September 2017. It uses the following technologies: Apache Spark v2.2.0, Python v2.7.3, Jupyter Notebook (PySpark), HDFS, Hive, Cloudera Impala, Cloudera HUE and Tableau.
apache-spark python jupyter-notebook pyspark hdfs hive cloudera hadoop impala hue tableau big-data spark functional-programming jupyter linux datawarehouse datamart mapreduce analytics
Language:Jupyter Notebook 6
Ranjandas / Dirty-CDH-Docker
A quick and dirty CDH cluster skeleton using Docker for Testing
cdh docker cloudera cloudera-hadoop
Language:Shell 6
tspannhw / minifi-jetson-nano
MiNiFi Agent Configuration and Scripts for NVidia Jetson Nano device
jetson-nano python nifi minifi efm cloudera
Language:Python 6
tspannhw / MmFLaNK
Mm FLaNK Stack (MXNet, MiNiFi, Flink, NiFi, Kafka, Kudu) for AI-IoT
apache-flink apache-mxnet apache-nifi apache-kafka apache-kudu minifi python java scala big-data cloudera
Language:Java 6

cloudera

HariSekhon / DevOps-Bash-tools

OryxProject / oryx

HariSekhon / Nagios-Plugins

hortonworks / cloudbreak

timveil / hive-jdbc-uber-jar

HariSekhon / HAProxy-configs

Pushkr / Apache-Spark-Hands-On

AlionSSS / CDH-Install-Manual

teamclairvoyant / hadoop-deployment-bash

ryandawsonuk / data-platforms-tools

san089 / Cloudera_Material

oracle-quickstart / oci-cloudera

teamclairvoyant / apache-airflow-cloudera-csd

HariSekhon / lib

teamclairvoyant / apache-airflow-cloudera-parcel

ummmme / setup_cdh

cloudera / tutorial-assets

tspannhw / FLiPStackWeekly

srowen / cdsw-simple-serving

cloudera / cdp-sdk-java

dmilan77 / cloudera-phoenix

HuemulSolutions / huemul-bigdatagovernance

chezou / homebrew-cloudera

kongyew / greenplum-dockers

cloudera / cdpcli

thammuio / doc-genius-ai

Sathiyarajan / big-data-pipeline

tspannhw / ClouderaFlowManagementWorkshop

smartlin5228 / CCA175

cloudera / cdpcurl

NFPA / LocationTools

Powerspace / kudu-from-avro

ptobarra / Business-Intelligence-on-Big-Data-_-U-TAD-2017-Big-Data-Master-Final-Project

Ranjandas / Dirty-CDH-Docker

tspannhw / minifi-jetson-nano

tspannhw / MmFLaNK