JuanParias29 / BigDataProcessing

Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.

Repository from Github https://github.comJuanParias29/BigDataProcessingRepository from Github https://github.comJuanParias29/BigDataProcessing

Repositorio de Procesamiento de Big Data

Este repositorio contiene proyectos y laboratorios relacionados con el curso de procesamiento de datos. Se exploran conceptos clave de Big Data, tecnologías empresariales para BI, almacenamiento y procesamiento de datos a gran escala con herramientas especializadas.

📌 Contenidos Temáticos

  • Almacenamiento y procesamiento de Big Data
  • Bases de Datos NoSQL y SQL
  • Datalakes y su implementación
  • Big Data analytics y visualización de datos
  • Aprendizaje Supervisado y No Supervisado con Big Data
  • Procesamiento de datos en Streaming y Grafos

🚀 Tecnologías y Herramientas Utilizadas

  • Databricks: Plataforma unificada para el análisis y procesamiento de datos
  • Apache Spark: Motor de procesamiento distribuido
  • Python: Lenguaje principal para la manipulación y análisis de datos

🚀 Colaborador

📅 Curso

Procesamiento de Datos a Gran Escala
📍 Pontificia Universidad Javeriana
👨‍🏫 Docente: John Corredor, PhD

¡Bienvenido a este viaje por el mundo de Big Data! 🚀

About

Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.


Languages

Language:Jupyter Notebook 100.0%