chenmh's repositories
grok-1
Grok open release
grokkingfp-examples
All examples and exercises from the Grokking Functional Programming book
Python-100-Days
Python - 100天从新手到大师
GrokConstructor
Semi-automatic incremental construction and debugging of regular expressions for grok to parse logfiles for logstash http://logstash.net/ . Deployed at http://grokconstructor.appspot.com/ .
flink-sql-lineage
The Lineage Analysis system for FlinkSQL supports advanced syntax such as Watermark, UDTF, CEP, Windowing TVFs, and CTAS.
DataX
DataX是阿里云DataWorks数据集成的开源版本。
Addax
Addax is a versatile open-source ETL tool that can seamlessly transfer data between various RDBMS and NoSQL databases, making it an ideal solution for data migration.
milvus
A cloud-native vector database, storage for next generation AI applications
yarb
方便获取每日安全资讯的爬虫和推送程序
daily_reminder
微信公众号全自动每日推送(先看README.md里的内容)
cs-self-learning
计算机自学指南
competition-baseline
数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路
incubator-streampark-quickstart
Apache StreamPark quickstart
flink-userportrait-main
基于Flink流处理的动态实时亿级全端用户画像系统
spider_job
招聘网数据爬虫
bookstore
使用Django编写一个书城电商网站,配合详细的教程。
daily_morning
给别人家的女朋友发早安
zookeeperDesign
⭐⭐⭐zk的设计与使用(集群,dubbo,分布式锁,master选举,负载均衡,watch,权限等)
flink-book
大数据,流计算,实时计算,Flink框架学习资料。畅销书籍《深入理解Flink核心设计与实践原理》 随书代码,书中讲解的Flink特性均有完整可运行的代码供读者运行和测试。整个工程共有【182个Java文件】,你要的Demo这里都有,相关特性见正文的目录。
examples-of-web-crawlers
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
LearningJDK
JDK源码阅读笔记
Taier
大数据平台-分布式任务调度系统
Lucky-Chenmh
Config files for my GitHub profile.
Waking-Up
计算机基础(计算机网络/操作系统/数据库/Git...)面试问题全面总结,包含详细的follow-up question以及答案;全部采用【问题+追问+答案】的形式,即拿即用,直击互联网大厂面试:rocket:;可用于模拟面试、面试前复习、短期内快速备战面试...
zdh_server
数据采集平台zdh,etl 处理服务
DataXServer
为DataX(https://github.com/alibaba/DataX) 提供远程多语言调用(ThriftServer,HttpServer) 分布式运行(DataX on YARN) 功能
EveHBase
华为HBase普通客户端和安全模式客户端,包括建表、建索引、异步请求、Put、Get、Scan等功能
Spark-2.3.1
Spark-2.3.1源码解读