sparksql

There are 8 repositories under sparksql topic.

zio / zio-quill
Compile-time Language Integrated Queries for Scala
database scala scalajs mysql postgres cassandra jdbc linq spark sparksql
Language:Scala 2146
harsha2010 / magellan
Geo Spatial Data Analytics on Spark
geospatial-analytics sparksql spark geometric-algorithms geojson shapefile geospatial geospatial-processing geospatial-analysis big-data magellan
Language:Scala 533
Stratio / sparta
Real Time Analytics and Data Pipelines based on Spark Streaming
analytics hdfs kafka lambda olap real-time scala spark spark-streaming sparksql sparta stratio stratio-sparta streaming streaming-data triggers workflow
Language:Scala 524
spirom / LearningSpark
Scala examples for learning to use Spark
scala spark spark-streaming sparkcore sparksql
Language:Scala 444
commoncrawl / cc-pyspark
Process Common Crawl data with Python and Spark
spark warc-files wet commoncrawl sparksql pyspark wat-files common-crawl
Language:Python 400
teeyog / IQL
An ad hoc query service based on the spark sql engine.(基于spark sql引擎的即席查询服务)
spark sparksql
Language:JavaScript 386
microsoft / data-accelerator
Data Accelerator for Apache Spark simplifies onboarding to Streaming of Big Data. It offers a rich, easy to use experience to help with creation, editing and management of Spark jobs on Azure HDInsights or Databricks while enabling the full power of the Spark engine.
spark spark-streaming spark-sql sparksql streaming-data streaming servicefabric nodejs docker hdinsight cosmosdb react azure apache-spark iothub eventhub big-data iot kafka kafka-streams
Language:C# 296
hbutani / spark-druid-olap
Sparkline BI Accelerator provides fast ad-hoc query capability over Logical Cubes. This has been folded into our SNAP Platform(http://bit.ly/2oBJSpP) an Integrated BI platform on Apache Spark.
spark business-intelligence olap-cube sparksql query-optimization
Language:Scala 285
locationtech / rasterframes
Geospatial Raster support for Spark DataFrames
spark sparksql scala geotrellis earth-observation image-processing machine-learning spark-ml
Language:Jupyter Notebook 243
zio / zio-protoquill
Quill for Scala 3
cassandra jdbc language-integrated-query linq postgresql scala spark sparksql sql
Language:Scala 202
bdp
bluishglc / bdp
A prototype project of big data platform, the source codes of the book Big Data Platform Architecture and Prototype
bigdata prototype quickstart spark spark-streaming spark-sql demo oozie redis kafka spark-demo spark-streaming-examples sqoop sqoop-import sparksql spark-examples middle-end middle-office
Language:Java 192
ZhuXS / Spring-Shiro-Spark
Spring-Shiro-Spark是Spring-Boot Hibernate Spark Spark-SQL Shiro iView VueJs... ...的集成尝试
spring-boot hibernate-jpa spark sparksql iview vuejs shiro-security
Language:Java 114
saurfang / sparksql-protobuf
Read SparkSQL parquet file as RDD[Protobuf]
protobuf sparksql parquet
Language:Scala 94
hyunjoonbok / PySpark
PySpark functions and utilities with examples. Assists ETL process of data modeling
spark hadoop pyspark pyspark-notebook pyspark-python pyspark-machine-learning pyspark-api sparksql
Language:Jupyter Notebook 92
CybercentreCanada / jupyterlab-sql-editor
A JupyterLab extension providing, SQL formatter, auto-completion, syntax highlighting, Spark SQL and Trino
jupyterlab extension ipython-magic lsp trino sparksql sql formatter auto-completion datagrid json schema nested-structures vscode-extension notebook syntax-highlighting dataframe
Language:Jupyter Notebook 82
funkyminds / cleanframes
type-class based data cleansing library for Apache Spark SQL
spark sparksql scala sparkscala shapeless bigdata apachespark
Language:Scala 79
swoop-inc / spark-records
Bulletproof Apache Spark jobs with fast root cause analysis of failures.
apache-spark big-data scala spark spark-records sparksql swoop
Language:Scala 72
zsvoboda / ngods
New generation opensource data stack
analytics data data-pipeline iceberg jdbc presto prestodb prestosql python scala spark spark-sql sparksql sql trino trinodb
Language:Dockerfile 60
potix2 / spark-google-spreadsheets
Google Spreadsheets datasource for SparkSQL and DataFrames
spreadsheet data-frame spark sparksql scala
Language:Scala 57
yaooqinn / spark-ranger
已经合入(apache/incubator-kyuubi) ACL Management for Apache Spark SQL with Apache Ranger.
spark sparksql ranger authorization acl data-masking row-level-security
Language:Scala 54
liumingmusic / HadoopLearning
全套大数据基础学习教程，包含最基础的centos、maven。大数据主要包含hdfs、mr、yarn、hbase、kafka、scala、sparkcore、sparkstreaming、sparksql。教程包含所有的源代码演示以及在线文档说明。
hadoop hdfs mapreduce maven centos yarn hbase spake2 scala sparkstreaming sparksql
Language:Scala 53
BenFradet / struct-type-encoder
Deriving Spark DataFrame schemas from case classes
spark sparksql
Language:Scala 44
jubins / Spark-And-MLlib-Projects
This repository contains Spark, MLlib, PySpark and Dataframes projects
spark mllib spark-ml sparksql spark-streaming spark-dataframes pyspark python aws-ec2
Language:Jupyter Notebook 40
DemoApps
4paradigm / DemoApps
demo applications that show how to deploy offline feature engineering solutions to online in one minute with fedb and nativespark
sql feature-engineering sparksql machine-learning tensorflow lightgbm realtime realtime-decision
Language:Python 35
yaooqinn / spark-postgres
PostgreSQL and GreenPlum Data Source for Apache Spark
spark sparksql transactional greenplum postgresql postgres
Language:Scala 35
spoddutur / cloud-based-sql-engine-using-spark
Cloud-based SQL engine using SPARK where data is accessible as JDBC/ODBC data source via Spark ThriftServer.
apache-spark thrift-server spark-thrift-server sql-engine sparksql jdbc beeline hadoop-framework
Language:Java 31
wushengyeyouya / Hive-JDBC-Proxy
Hive-JDBC-Proxy是一个高性能的HiveServer2和Spark ThriftServer的代理服务，具备负载均衡、基于规则转发Hive JDBC Client的请求给到HiveServer2和Spark ThriftServer的能力。
hive hiveql hiveserver2 spark spark-sql sparksql thrift-server jdbc jdbc-driver proxy
Language:Scala 31
lei-zuquan / java_spark
Spark 2.x 案例操作：Scala版本与 Java1.8lambda版代码示例。涵盖Spark核心技术操作SparkCore、SparkSql、SparkStreaming。同时提供了Spark高级性能优化、序列化、广播变量、数据倾斜、算子优化、JVM优化、troubleshooting、数据倾斜解决方案。是多年来根据工作积累整理出来！
spark java-8 scala sparkcore sparksql sparkstreaming kafka
Language:Java 26
bjkonglu / resume-bjkonglu
记录Spark、Flink研究经验
spark sparksql kerberos flink
25
SharpRay / spark-druid-connector
A library for querying Druid data sources with Apache Spark
spark druid connector sparksql
Language:Scala 23
s22s / pre-lt-raster-frames
Spark DataFrames for earth observation data
spark sparksql scala geotrellis earth-observation image-processing machine-learning spark-ml
Language:Scala 19
pzfreo / ox-clo
Materials for Oxford Software Engineering Programme CLO course
cloud spark sparksql education educational python aws ec2 bigdata bigdatalearning
Language:Jupyter Notebook 16
JunjianS / spark-streaming-kafka-demo
spark streaming从kafka读取消息，offset写入Redis，spark计算单词出现频率，最后写入hive表
springboot spark kafka hive redis spark-streaming spark-sql sparksql java
Language:Java 15
largecats / sparksql-formatter
A SparkSQL formatter based on https://github.com/zeroturnaround/sql-formatter, with customizations and extra features.
formatter python sparksql query-language
Language:Python 14
cvilla87 / PySpark-ETL-Telecom
Jupyter Notebook showing how to process Telecom datasets using PySpark (SparkSQL and DataFrames) and plotting the results using Matplotlib.
pyspark spark sparksql python jupyter-notebook matplotlib csv json hdfs hadoop unix etl dataframe
Language:Jupyter Notebook 13
dazheng / SparkETL
Implement a complete data warehouse etl using spark SQL
sparksql spark etl datawarehouse
Language:Java 13

sparksql

zio / zio-quill

harsha2010 / magellan

Stratio / sparta

spirom / LearningSpark

commoncrawl / cc-pyspark

teeyog / IQL

microsoft / data-accelerator

hbutani / spark-druid-olap

locationtech / rasterframes

zio / zio-protoquill

bluishglc / bdp

ZhuXS / Spring-Shiro-Spark

saurfang / sparksql-protobuf

hyunjoonbok / PySpark

CybercentreCanada / jupyterlab-sql-editor

funkyminds / cleanframes

swoop-inc / spark-records

zsvoboda / ngods

potix2 / spark-google-spreadsheets

yaooqinn / spark-ranger

liumingmusic / HadoopLearning

BenFradet / struct-type-encoder

jubins / Spark-And-MLlib-Projects

4paradigm / DemoApps

yaooqinn / spark-postgres

spoddutur / cloud-based-sql-engine-using-spark

wushengyeyouya / Hive-JDBC-Proxy

lei-zuquan / java_spark

bjkonglu / resume-bjkonglu

SharpRay / spark-druid-connector

s22s / pre-lt-raster-frames

pzfreo / ox-clo

JunjianS / spark-streaming-kafka-demo

largecats / sparksql-formatter

cvilla87 / PySpark-ETL-Telecom

dazheng / SparkETL