lumin115's repositories
address-parse
🌏对国内地址地区进行智能解析,提取关键数据,如有识别不准的地址请Issues
addressparser
中文地址提取工具,支持**三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。
AreaCity-JsSpider-StatsGov
省市区县乡镇三级或四级城市数据,带拼音标注、坐标、行政区域边界范围;2021年03月21日最新采集,提供csv格式文件,支持在线转成多级联动js代码、通用json格式,提供软件转成shp、geojson、sql、导入数据库;带浏览器里面运行的js采集源码,综合了中华人民共和国民政部、国家统计局、高德地图、腾讯地图行政区划数据
Chinese-BERT-wwm
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
chineseocr_lite
超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M
crfpp
CRF++: Yet Another CRF toolkit
d2l-en
Interactive deep learning book with multi-framework code, math, and discussions. Adopted at 300 universities from 55 countries including Stanford, MIT, Harvard, and Cambridge.
d2l-zh
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被55个国家的300所大学用于教学。
data-science-competition
该仓库用于记录作者本人参加的各大数据科学竞赛的获奖方案源码以及一些新比赛的原创baseline. 主要涵盖:kaggle, 阿里天池,华为云大赛校园赛,百度aistudio,和鲸社区,datafountain等
deeplearning-models
A collection of various deep learning architectures, models, and tips
flair
A very simple framework for state-of-the-art Natural Language Processing (NLP)
gensim
Topic Modelling for Humans
HanLP
中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
HarvestText
文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法
JioNLP
中文 NLP 预处理工具包,准确、高效、易用 A Chinese NLP Preprocessing Package
learn-nlp-with-transformers
we want to create a repo to illustrate usage of transformers in chinese
NLP-Series-NewWordsMining-PTMPretraining
NLP实验:新词挖掘+预训练模型继续Pre-training
OCR-Corrector
利用语言模型,纠正OCR识别错误
PatrickStar
PatrickStar enables Larger, Faster, Greener Pretrained Models for NLP and democratizes AI for everyone.
pyhanlp
中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
sentence-transformers
Multilingual Sentence & Image Embeddings with BERT
Statistical-Learning-Method_Code
手写实现李航《统计学习方法》书中全部算法
torchkeras
Pytorch❤️ Keras 😋😋
transformers
🤗 Transformers: State-of-the-art Natural Language Processing for Pytorch, TensorFlow, and JAX.
VIMER
视觉预训练基础模型仓库