haisimao's repositories
Baichuan2-Explained
Baichuan2代码的逐行解析版本,适合小白
alldata
🔥🔥 AllData科学护城河:一种在数据驱动的科学和研究领域中,保护和维护数据的竞争优势和独特性的解决方案。AllData通过汇聚大数据与AI领域生态组件,提供自定义化数据中台。包括大数据生态方案,人工智能生态方案,大数据组件运维方案,大数据开发治理方案,机器学习方案,大数据SQL开发ChatGPT方案,数据集成方案,湖仓分析方案。通过社区文档了解更多内容:https://docs.qq.com/doc/DVHlkSEtvVXVCdEFo
God-Of-BigData
专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
flink-sql-lineage
FlinkSQL字段血缘解决方案及源码。FlinkSQL field lineage solution and source code, The core idea is to parse SQL through Calcite to generate a RelNode tree of relational expressions. Then get the optimized logical paln through optimization stage, and finally call Calcite RelMetadataQuery to get the lineage relationship at the field level.
TensorFlowOnSpark
TensorFlowOnSpark brings TensorFlow programs to Apache Spark clusters.
deep_recommenders
Deep Recommenders
spline
Data Lineage Tracking And Visualization Solution
nlp-notebook
NLP 领域常见任务的实现,包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。
PracticalGuidetoRecSys
《互联网大厂推荐算法实战》资料库
text_match
文本匹配算法,单塔模型和双塔模型
anPingworkSpace
安平 思文的代码
BERT-Embedding-Frequently-Asked-Question
FAQ-based Question Answering System using BERT
NLP-Interview-Notes
该仓库主要记录 NLP 算法工程师相关的面试题
NLP_ability
总结梳理自然语言处理工程师(NLP)需要积累的各方面知识,包括面试题,各种基础知识,工程能力等等,提升核心竞争力
CoolplaySpark
酷玩 Spark: Spark 源代码解析、Spark 类库等
bert
TensorFlow code and pre-trained models for BERT
RecLearn
Recommender Learning with Tensorflow2.x
AI-RecommenderSystem
该仓库尝试整理推荐系统领域的一些经典算法模型
entity_extractor_by_ner
基于Tensorflow2.3开发的Ner模型,包含Bilstm(IDCNN)-CRF、Bert-Bilstm(IDCNN)-CRF、Bert-CRF,可微调预训练模型,可对抗学习,用于命名实体识别,配置后可直接运行。
KBQA-for-Diagnosis
Knowledge Graph,Question Answering System,基于知识图谱和向量检索的医疗诊断问答系统
TextMatch
QAmatch(qa_match)/文本匹配/文本分类/文本embedding/文本聚类/文本检索(bow/ifidf/ngramtf-df/bert/albert/bm25/…/nn/gbdt/xgb/kmeans/dscan/faiss/….)
nlp-basictasks
A simple framework for building some basic NLP tasks
xposed-rimet
这是一个钉钉的Xposed模块项目
Medical-Robot-AI
基于Rasa框架实现的智能医疗机器人 功能包含: 医药问答 智能问药 疾病诊断 病症查询 症状查询 闲聊 天气查询 语音对话 使用手段包括: rasa框架 知识图谱 neo4j数据库 语音识别 语音合成 开放API 等功能
qqzeng-ip
最新IP地址数据库-多语言解析以及导入数据库脚本
TianChi_RecSys_AntiSpam
第三届 Apache Flink 极客挑战赛暨AAIG CUP——电商推荐“抱大腿”攻击识别亚军代码方案
CrimeKgAssitant
Crime assistant including crime type prediction and crime consult service based on nlp methods and crime kg,罪名法务智能项目,内容包括856项罪名知识图谱, 基于280万罪名训练库的罪名预测,基于20W法务问答对的13类问题分类与法律资讯问答功能.