Neil's repositories
WorkSpark
spark2kafka2es
picx-images-hosting
PicX images hosting repository
vue_admin
vue后台管理
awesome-python
A curated list of awesome Python frameworks, libraries, software and resources
WordToMysql
word context to mysql
data-manager
超实用的hive表数据、分区,hdfs文件的自动化清理工具
logger
log2kafka
log_produce
模拟用户行为数据产生
datax-cloud
智数通提供了元数据管理、数据标准管理、数据质量管理、主数据管理、数据集市管理、可视化图表看板、流程管理等微服务,是为数字化建设而生的企业级一站式数据治理平台。
vue-metadata
元数据管理系统(leap metadata)是用于企业内进行元数据管理的Web应用程序。该系统提供直观的用户页面。用户可以使用该系统管理企业所拥有的元数据,如查看元数据基本信息、数据所在位置、数据的血缘关系等。本系统支持管理员和普通用户的分级操作。
Hive_Tools
sql解析,hql解析,hive脚本转mysql,解析hive,sparkSql,ER图自动生成、Excel自动生成 大数据搬砖神器
dolphinscheduler
Apache DolphinScheduler is a distributed and extensible workflow scheduler platform with powerful DAG visual interfaces, dedicated to solving complex job dependencies in the data pipeline and providing various types of jobs available `out of the box`.
webkettle
基于web版kettle开发的一套分布式综合调度,管理,ETL开发的用户专业版B/S架构工具
BlogHelper
帮助国内用户写作的托盘助手,一键发布本地文章到主流博客平台(知乎、简书、博客园、CSDN、SegmentFault、掘金、开源**),剪贴板图片一键上传至图床(新浪、Github、图壳、腾讯云、阿里云、又拍云、七牛云)
daily-summary
大数据相关知识总结 + demo
spark-kompactor
Simple spark application to merge small files of structured data underline Hive table.
fastapi_plus
这是一个Python FastAPI项目工程库,包含DB、Redis、MongoDB、JSON等工具和基础服务类。
data-lineage-parent
数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘
ipdatabase
IP geolocation binary tree search
Jusic-Serve-Houses
一起听歌吧多房间版本(music.alang.run)
Jusic-serve
一起听歌吧(同步点歌听歌),多房间版本也已开源
legoo
Legoo: A collection of automation modules to build analytics infrastructure
crawler
spark和hive处理大数据demo
spark-df-profiling
Create HTML profiling reports from Apache Spark DataFrames
py12306
🚂 12306 购票助手,支持集群,多账号,多任务购票以及 Web 页面管理