hadoop-mapreduce

There are 13 repositories under hadoop-mapreduce topic.

mahmoudparsian / data-algorithms-book
MapReduce, Spark, Java, and Scala for Data Algorithms Book
hadoop-mapreduce java distributed-computing scala mapreduce data-algorithms python machine-learning pyspark distributed-algorithms mappers reducers apache-hadoop apache-spark design-patterns partitioning
Language:Java 1081
bytedance / CloudShuffleService
Cloud Shuffle Service(CSS) is a general purpose remote shuffle solution for compute engines, including Spark/Flink/MapReduce.
flink spark hadoop-mapreduce
Language:Java 261
touero / ctenopharyngodon-idella
Use the MapReduce's Java interface to distributed crawle the data of Chinese universities and learn basic knowledge of hdfs.
fastapi hadoop hadoop-mapreduce java mapreduce maven scraping
Language:Java 135
big_data
groda / big_data
Big Data essentials: Hadoop, MapReduce, Spark. Explore tutorials and demos in Jupyter notebooks—most are self-contained and live, ready to run with a click.
big-data bigdata spark spark-sql docker mapreduce mapreduce-bash pyspark hadoop testdfsio jupyter-notebook apache-sedona hadoop-cluster hadoop-hdfs mrjob gutenberg-ebooks hadoop-mapreduce apache-spark bigtop
Language:Jupyter Notebook 84
vim89 / datapipelines-essentials-python
Simplified ETL process in Hadoop using Apache Spark. Has complete ETL pipeline for datalake. SparkSession extensions, DataFrame validation, Column extensions, SQL functions, and DataFrame transformations
apache-spark spark spark-sql python python3 pyspark etl etl-pipeline etl-framework etl-components xml xml-parsing datalake big-data hadoop hadoop-mapreduce hadoop-hdfs data-pipeline
Language:Python 55
maniram-yadav / Big_DataHadoop_Projects
Big data projects implemented by Maniram yadav
spark pig-latin pig hadoop hdfs sqoop hive mapreduce big-data-analytics big-data-projects hadoop-mapreduce hadoop-hdfs flume
Language:PigLatin 49
seraogianluca / k-means-mapreduce
K-Means algorithm implementation with Hadoop and Spark for the course of Cloud Computing of the MSc AIDE at the University of Pisa.
machine-learning-algorithms k-means-clustering hadoop-mapreduce spark kmeans-algorithm centroids-initialization hadoop iteration clustering-algorithm
Language:Java 47
caizkun / mapreduce-examples
A collection of mapreduce problems and solutions
mapreduce hadoop-mapreduce
Language:Java 35
anjalysam / Hadoop
This contain how to install Hadoop on google colab and how to run map-reduce in Hadoop
hadoop hadoop-mapreduce hadoop-installation
Language:Jupyter Notebook 33
absnaik810 / CloudComputing
Projects done in the Cloud Computing course.
hadoop hadoop-mapreduce hbase inverted-index nosql hdfs pagerank
Language:Java 27
arshdeepbahga / cloud-computing-solutions-architect-book-code
Source code for the examples in the book Cloud Computing Solutions Architect: A Hands-On Approach by Arshdeep Bahga and Vijay Madisetti
cloud-computing aws aws-lambda aws-s3 aws-dynamodb boto3 aws-ec2 aws-iot aws-sqs aws-apigateway aws-iam aws-rd serverless-architectures hadoop-mapreduce spark storm flink spark-streaming aws-neptune mongodb
Language:CSS 24
jmaister / wordcount
Hadoop MapReduce word counting with Java
hadoop-mapreduce java maven wordcount
Language:Java 24
jyzhangchn / FBDP-project2
中文文本挖掘|舆情分析|Hadoop|Java|MapReduce
java knn mapreduce-java naive-bayes hadoop-mapreduce
Language:HTML 23
MoustafaAMahmoud / BigDataInDepth
Data Engineering Course
hadoop hadoop-mapreduce spark distributed-systems scala kafka dwh distrubted-systems
Language:TeX 21
pfisterer / apache-hadoop-helm
Helm chart for Apache Hadoop using multi-arch docker images
hadoop hadoop-hdfs hadoop-mapreduce hadoop-filesystem helm-chart helm docker kubernetes
Language:Dockerfile 20
benedekh / bigdata-projects
Student projects in Big Data field.
bigdata big-data apache-spark hadoop spark hadoop-mapreduce mapreduce
Language:Java 19
QiushiSun / Distributed-Computing-Systems
2021 Spring (Distributed Computing Systems) 分布式系统与编程
distributed-systems distributed-computing spark hadoop-mapreduce flink ecnu-dase
Language:Java 16
Keerthivasan13 / CSCI572-Information_Retrieval_And_Web_Search_Engines
Search Engine projects
information-retrieval scraping-websites crawling pagerank-algorithm pagerank hadoop-mapreduce hadoop apache solr lucene tika jsoup crawler4j networkx search-engine autocomplete spellchecker peter-norvig iditom php
Language:Java 15
lucas91batista / twitter-hashtag-graph
Twitter + Flume + Hadoop (HDFS, MapReduce) + Neo4j + Pyhton
twitter apache-flume hadoop hadoop-mapreduce hadoop-hdfs neo4j
Language:JavaScript 15
rajatgarg149 / BigData-Essentials-HDFS-SPARK-RDD
big-data big-data-essentials coursera coursera-big-data yandex-big-data spark mapreduce apache-spark hadoop hadoop-mapreduce distributed-file-system
Language:Jupyter Notebook 15
FirasKahlaoui / hadoop-docker-spark
Report : (Docker-Hadoop) installation - Analyse data with Spark (Scala)
docker hadoop hadoop-mapreduce kaggle-dataset scala spark linux
13
James-QiuHaoran / distributed-computing-platform-mapreduce
This repository contains a simple Hadoop-like (MapReduce) distributed computing platform implemented in Java. It is extended from a course project at UIUC awarded the best Java version implementation and it's open-sourced for reference.
mapreduce hadoop hadoop-mapreduce distributed-computing distributed-file-system membership-management failure-detection distributed-systems cloud-computing cloud-computing-applications hadoop-framework
Language:Java 13
SAKET-SK / Semester6-SPPU-Data-Analysis-Lab
I installed Hadoop on Virtual Machine and all Assignments are performed on Ubuntu OS. Refer to this repo for completion of the Hadoop Assignments. It is recommended that you have a stable internet connection while doing these things.
hadoop hadoop-mapreduce hadoop-bigdata-assignments hadoop-framework hadoop-assignments r tableau data-visualization charts plot
Language:Rebol 13
waltherg / distributable_docker_sql_on_hadoop
Toy Hadoop cluster combining various SQL-on-Hadoop variants
hadoop hadoop-mapreduce hadoop-filesystem hadoop-cluster hadoop-docker hadoop-hdfs hadoop-framework hive hue spark sparksql hbase hbase-client yarn yarn-hadoop-cluster zookeeper zookeeper-deployment tez impala presto
Language:Shell 12
Areesha-Tahir / Hadoop-MapReduce-Sentiment-Analysis-Through-Keywords
A MapReduce program to conduct sentiment analysis of a keyword from a list of comments.
mapreduce parallel-computing parallel-programming sentiment-analysis code project java ubuntu hadoop-mapreduce hadoop-hdfs hadoop
Language:Java 11
giovannigarifo / bigdata
Code samples, summaries, cheatsheets and other study material for Hadoop MapReduce and Apache Spark
big-data bigdata hadoop hadoop-mapreduce hadoop-framework spark spark-streaming sparkjava spark-sql sparksql spark-mllib spark-ml polito mapreduce politecnico-di-torino
Language:Java 11
hyeonsangjeon / dataplatform
Hadoop3.2 single/cluster mode with web terminal gotty, spark, jupyter pyspark, hive, eco etc.
hadoop hadoop-cluster hadoop-docker hadoop-mapreduce hadoop-ecosystem hive pyspark-notebook zeppelin-notebook
Language:Shell 11
manasbundele / big-data-projects
These are a select few projects related to Big Data Analytics and Management. The projects listed are a combination of both small and big projects but interesting ones.
scala python spark spark-streaming-kafka hadoop-mapreduce
Language:HTML 10
pasqualesalza / elephant56
A Genetic Algorithms framework for Hadoop MapReduce.
genetic-algorithm hadoop parallel hadoop-mapreduce
Language:Java 10
guillaume6pl / mr_pagerank
Computing pagerank with Hadoop MapReduce
pagerank hadoop-mapreduce python search
Language:Python 9
imsanjoykb / PySpark-Bootcamp
My Practice and project on PySpark
pyspark transformation spark-sql spark-streaming sparkjava hadoop hadoop-mapreduce pyspark-notebook pyspark-machine-learning pyspark-mllib pyspark-ml
Language:Jupyter Notebook 8
joshi-aditya / Amazon-Reviews-Dataset-Analysis-MapReduce
Amazon Customer Reviews Dataset Analysis using Hadoop MapReduce, Pig. Semester end project for INFO7250 Engineering of Big Data Systems course.
mapreduce hadoop-mapreduce
Language:Java 8
Pawan300 / Hadoop-practical-
hadoop hadoop-mapreduce hdfs hdfs-dfs spark pyspark machine-learning-algorithms
Language:Jupyter Notebook 8
shask9 / Matrix-Multiplication-Hadoop
Hadoop MapReduce program to compute multiplication of two sparse matrices
hadoop hadoop-mapreduce xsede java
Language:Java 8
suselong / bigData-30-Days
零基础大数据学习笔记
bigdata hadoop hadoop-mapreduce hadoop-framework
Language:Java 8
LMAPcoder / Hadoop-on-Colab
Installation and configuration of Hadoop on Google Colaboratory
hadoop hadoop-hdfs hadoop-installation hadoop-mapreduce hadoop-streaming
Language:Jupyter Notebook 7

hadoop-mapreduce

mahmoudparsian / data-algorithms-book

bytedance / CloudShuffleService

touero / ctenopharyngodon-idella

groda / big_data

vim89 / datapipelines-essentials-python

maniram-yadav / Big_DataHadoop_Projects

seraogianluca / k-means-mapreduce

caizkun / mapreduce-examples

anjalysam / Hadoop

absnaik810 / CloudComputing

arshdeepbahga / cloud-computing-solutions-architect-book-code

jmaister / wordcount

jyzhangchn / FBDP-project2

MoustafaAMahmoud / BigDataInDepth

pfisterer / apache-hadoop-helm

benedekh / bigdata-projects

QiushiSun / Distributed-Computing-Systems

Keerthivasan13 / CSCI572-Information_Retrieval_And_Web_Search_Engines

lucas91batista / twitter-hashtag-graph

rajatgarg149 / BigData-Essentials-HDFS-SPARK-RDD

FirasKahlaoui / hadoop-docker-spark

James-QiuHaoran / distributed-computing-platform-mapreduce

SAKET-SK / Semester6-SPPU-Data-Analysis-Lab

waltherg / distributable_docker_sql_on_hadoop

Areesha-Tahir / Hadoop-MapReduce-Sentiment-Analysis-Through-Keywords

giovannigarifo / bigdata

hyeonsangjeon / dataplatform

manasbundele / big-data-projects

pasqualesalza / elephant56

guillaume6pl / mr_pagerank

imsanjoykb / PySpark-Bootcamp

joshi-aditya / Amazon-Reviews-Dataset-Analysis-MapReduce

Pawan300 / Hadoop-practical-

shask9 / Matrix-Multiplication-Hadoop

suselong / bigData-30-Days

LMAPcoder / Hadoop-on-Colab