datafusion

There are 4 repositories under datafusion topic.

apache / datafusion
Apache DataFusion SQL Query Engine
arrow big-data dataframe datafusion olap python query-engine rust sql
Language:Rust 5616
ibis-project / ibis
the portable Python dataframe library
python impala pandas database clickhouse postgresql sqlite mysql datafusion sql pyspark dask duckdb bigquery pyarrow mssql polars snowflake trino sqlalchemy
Language:Python 4631
roapi / roapi
Create full-fledged APIs for slowly moving datasets without writing a single line of code.
analytics arrow blob-storage cloud-native columnar datafusion datasets delta-lake graphql in-memory-database parquet query query-frontends rest-api rust s3 sql static-datasets
Language:Rust 3160
lakesoul-io / LakeSoul
LakeSoul is an end-to-end, realtime and cloud native Lakehouse framework with fast data ingestion, concurrent update and incremental data analytics on cloud storages for both BI and AI applications.
arrow big-data datafusion datalake flink huggingface lakehouse lakesoul postgresql python pytorch rust spark sql streaming vectorized velox
Language:Java 2342
apache / datafusion-comet
Apache DataFusion Comet Spark Accelerator
arrow datafusion rust spark
Language:Rust 679
seafowl
splitgraph / seafowl
Analytical database for data-driven Web applications 🪶
api database datafusion delta-lake delta-rs edge http rust serverless sql visualization
Language:Rust 394
kamu-data / kamu-cli
New generation decentralized data lake and a streaming data pipeline
spark flink sql jupyter blockchain kamu open-data open-data-fabric data-management data-as-code data-science datafusion
Language:Rust 284
PRQL / prql-query
Query and transform data with PRQL
csv csv-converter csv-files data database datafusion duckdb json json-files parquet parquet-files parquet-tools parquet-viewer postgresql prql query querydsl
Language:Rust 123
JanKaul / iceberg-rust
Rust implementation of Apache Iceberg with integration for Datafusion
arrow datafusion iceberg rust
Language:Rust 77
datafusion-contrib / datafusion-java
Java binding to Apache Arrow DataFusion
java arrow datafusion ballista
Language:Java 61
hw2499 / etl-engine
etl engine 轻量级跨平台流批一体ETL引擎数据抽取-转换-装载 ETL engine lightweight cross platform batch flow integration ETL engine data extraction transformation loading
clickhouse etl kafka mysql rocketmq etl-engine influx crontab redis prometheus elastic oracle postgresql sqlite3 hive datafusion mysqlbinlog cdc hbase sqlserver
Language:Go 61
jorgecarleitao / datafusion-python
A Python library to run analytics workloads with the performance of Rust, the flexibility of Python and O(1) cost in moving data between the two. Uses Apache Arrow in-memory format and respective query engine DataFusion.
rust python udfs datafusion
Language:Rust 60
datafusion-contrib / datafusion-objectstore-s3
S3 as an ObjectStore for DataFusion
rust datafusion
Language:Rust 59
datafusion-contrib / datafusion-python
Python binding for DataFusion
arrow datafusion maturin python
Language:Python 59
shauryashaurya / learn-data-munging
Notes on Data Engineering with Pandas, PySpark, Dask, Ray, Arrow DataFusion, Polars etc.
dask data-engineering jupyter pandas pyspark ray spark arrow dask-distributed datafusion numpy polars
Language:Jupyter Notebook 43
splitgraph / seafowl-gcsfuse
Scale to zero Seafowl hosting with Cloud Run
faas gcp rust severless datafusion seafowl
Language:Dockerfile 39
metrico / influxdb3-community
Community InfluxDB 3.0 "IOx" static builds + containers + Examples for Developers & Integrators. Experiment with low-cost storage, unlimited cardinality and FlightSQL APIs
datafusion influxdb iox lineprotocol flightsql flux influx musl arrow rust influxdb3
Language:Shell 37
paradedb / pg_analytics
Analytical table access method for Postgres
analytics arrow columnar datafusion lakehouse paradedb parquet postgres postgresql
Language:Rust 34
wheretrue / exon
Exon is an OLAP query engine specifically for biology and life science applications.
arrow bioinformatics datafusion ngs proteomics rust sql
Language:Rust 34
treebee / elixir-arrow
Experimental Elixir bindings for Apache Arrow including Parquet and DataFusion
parquet arrow datafusion query-engine
Language:Rust 33
baggiponte / awesome-pandas-alternatives
Awesome list of alternative dataframe libraries in Python.
awesome awesome-list python pandas sql apache-arrow arrow polars datafusion rapidsai datatable dask cudf blazingsql
32
datafusion-contrib / datafusion-c
C language bindings for DataFusion
apache-arrow c datafusion glib sql
Language:C 16
fmenat / MultiviewCropClassification
Public repository of our IGARSS 2023 submission
agriculture-research crop-classification crop-type-mapping croptypes data-fusion datafusion multi-modal-learning multi-view-learning multimodal-learning multisensor-fusion multiview-learning remote-sensing remote-sensing-image crop-type-mapp
Language:Python 13
blaze-init / spark-blaze-extension
Blazing-fast query execution engine speaks Apache Spark language and has Arrow-DataFusion at its core.
spark datafusion arrow
Language:Shell 11
ModelarData / ModelarDB-RS
ModelarDB: Model-Based Time Series Management from Edge to Cloud
apache-arrow datafusion industrial-iot rust time-series time-series-database
Language:Rust 10
grouzen / zio-apache-arrow
ZIO-powered Apache Arrow library
arrow datafusion scala zio
Language:Scala 8
apache / datafusion-benchmarks
Apache DataFusion Benchmarks
benchmarks datafusion
Language:Python 7
sal-openlab / datafusion-server
Rust DataFusion Server
arrow datafusion rust sql
Language:Rust 7
milenkovicm / wasaffi
Datafusion WASM User Defined Functions
datafusion sql userdefined-functions wasm wasm-bindgen wasmedge
Language:Rust 6
roeap / flight-fusion
arrow flight deltalake data-science datafusion
Language:Rust 6
hengfeiyang / how-query-engines-work-zh-CN
How Query Engines Work 中文版
arrow ballista datafusion parquet
4
splitgraph / experimental-datafusion-webassembly
proof-of-concept: compile datafusion to `wasm32-wasi` (run in `wasmedge`) and `wasm32-unknown-unknown` (run in browser)
arrow datafusion webassembly wasm32-unknown-unknown wasm32-wasi wasmedge
4
Caoxuheng / HyMS
OL: Code for "Hyperspectral Image Super-resolution via Multi-stage Scheme without Employing Spatial Degradation"
datafusion super-resolution hyperspectral-imaging total-variation
Language:Python 3
milenkovicm / adhesive
Apache Datafusion JVM User Defined Functions (UDF), integration nobody asked for 😀
datafusion java rust sql userdefined-functions arrow jni jvm udf udf-libraries bytecode-compiler compiler
Language:Rust 3
cmackenzie1 / deltalake-examples-rs
Examples of working with the DeltaLake in Rust!
delta-lake deltalake datafusion rust
Language:Rust 2
milenkovicm / torchfusion
Torchfusion is a very opinionated torch inference on datafusion.
datafusion rust sql torch userdefined-functions pytorch batch-inference inference machine-learning
Language:Rust 2

datafusion

apache / datafusion

ibis-project / ibis

roapi / roapi

lakesoul-io / LakeSoul

apache / datafusion-comet

splitgraph / seafowl

kamu-data / kamu-cli

PRQL / prql-query

JanKaul / iceberg-rust

datafusion-contrib / datafusion-java

hw2499 / etl-engine

jorgecarleitao / datafusion-python

datafusion-contrib / datafusion-objectstore-s3

datafusion-contrib / datafusion-python

shauryashaurya / learn-data-munging

splitgraph / seafowl-gcsfuse

metrico / influxdb3-community

paradedb / pg_analytics

wheretrue / exon

treebee / elixir-arrow

baggiponte / awesome-pandas-alternatives

datafusion-contrib / datafusion-c

fmenat / MultiviewCropClassification

blaze-init / spark-blaze-extension

ModelarData / ModelarDB-RS

grouzen / zio-apache-arrow

apache / datafusion-benchmarks

sal-openlab / datafusion-server

milenkovicm / wasaffi

roeap / flight-fusion

hengfeiyang / how-query-engines-work-zh-CN

splitgraph / experimental-datafusion-webassembly

Caoxuheng / HyMS

milenkovicm / adhesive

cmackenzie1 / deltalake-examples-rs

milenkovicm / torchfusion