BerryHNN's repositories
milvus
An open-source vector database for scalable similarity search and AI applications.
UER-py
Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo
AutoGL
An autoML framework & toolkit for machine learning on graphs.
unilm
Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities
KgCLUE
KgCLUE: 大规模中文开源知识图谱问答
HNN
这样的生活
NLPer-Arsenal
收录NLP相关竞赛经验贴(当前赛事、往期赛事、训练赛)、NLP会议时间、常用自媒体、GPU推荐等,持续更新中
Bert-In-Relation-Extraction
使用Bert完成实体之间关系抽取
FSL-Mate
FSL-Mate: A collection of resources for few-shot learning (FSL).
HDLTex
HDLTex: Hierarchical Deep Learning for Text Classification
Real_Time_DataMining_Software
携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线 UGC 进行数据挖掘并可视化,demo 视频演示见链接。
Customer_Satisfaction_Analysis
基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI 信息的功能;构建了基于在线民宿语料的 LDA 自动主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后 litNlp 自带的字符级 TextCNN 进行情感分析,将情感分类概率分布作为情感趋势,最后通过 POI 热力图的方式对不同地域的民宿满意度进行展示。软件版本请见链接。
DeepCTR
Easy-to-use,Modular and Extendible package of deep-learning based CTR models for search and recommendation.
CCKS2019_EventEntityExtraction_Rank5
SEBERTNets:一种面向金融领域的事件主体抽取方法
Literature-Clustering-Bert
使用开源的Bert-as-Service预训练生成文档特征向量,基于k-means对COVID-19文献聚类,t-SNE可视化数据,通过LDA为每个簇生成主题关键词,画Bokeh图实现按簇、关键词搜索和筛选数据。
pygeography
提供计算地理距离、经纬度转换等功能的python工具包