yzh's starred repositories
NLP-Interview-Notes
该仓库主要记录 NLP 算法工程师相关的面试题
Awesome-Multimodal-Large-Language-Models
:sparkles::sparkles:Latest Advances on Multimodal Large Language Models
MedicalGPT
MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO。
BigData-In-Practice
大数据实践项目 Hadoop、Spark、Kafka、Hbase、Flink.....
YesPlayMusic
高颜值的第三方网易云播放器,支持 Windows / macOS / Linux :electron:
ailearning
AiLearning:数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2
News_Spark
基于Spark2.x新闻网大数据实时分析可视化系统项目
SMP-Keyword-Extraction
CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。
SchoolBigDataAnalysis
此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用sparkSQL集合hive进行大数据分析
God-Of-BigData
专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
StudySpark
学习 Spark 的一个小项目,以及其中各种调优的笔记
JavaBigData
【大数据必备】非科班转行Java大数据面经分享
ResumeSample
Resume template for Chinese programmers . 程序员简历模板系列。包括PHP程序员简历模板、iOS程序员简历模板、Android程序员简历模板、Web前端程序员简历模板、Java程序员简历模板、C/C++程序员简历模板、NodeJS程序员简历模板、架构师简历模板以及通用程序员简历模板