hank's repositories
-_megemini-
瑞金医院知识图谱大赛总决赛第四名比赛攻略_megemini队
bert-utils
一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
Blog-Share
SWUFE奇点工作室学习博客交换站
ccks2019-ckbqa-4th-codes
中文知识库问答代码,CCKS2019 CKBQA评测第四名解决方案
COVID-19-TweetIDs
The repository contains an ongoing collection of tweets IDs associated with the novel coronavirus COVID-19 (SARS-CoV-2), which commenced on January 28, 2020.
python-tools
自己写的python小工具
creditcard
通过模型训练信用卡欺诈数据,得出预测结果,并对模型进行评估
lightNLP
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译、文本摘要等功能。框架功能丰富,开箱可用,极易上手!基本都是学习他人实现然后自己修改融合到框架中,没有细致调参,且有不少Bug~
Listed-company-news-crawl-and-text-analysis
从新浪财经、每经网、金融界、**证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据进行文本分析、提取特征集,然后利用SVM、随机森林等分类器进行训练,最后对实施抓取的新闻数据进行分类预测
nlp-beginner
NLP上手教程
pass_the_pigs_python
The python implement of game Pass The Pigs
PPD_Overdue_Prediction
“拍拍贷”贷款逾期概率预测 [https://www.kesci.com/apps/home/competition/56cd5f02b89b5bd026cb39c9/content]
stock-knowledge-graph
利用网络上公开的数据构建一个小型的证券知识图谱/知识库
text-similarity
用TF特征向量和simhash指纹计算中文文本的相似度