Beast code in Giters

lumin115's repositories

Blog

Python机器学习算法技术博客，有原创干货！有code实践！

Language:Jupyter Notebook1 10

PaddleNLP

An NLP library with Awesome pre-trained Transformer models and easy-to-use interface, supporting wide-range of NLP tasks from research to industrial applications.

Language:PythonApache-2.01 10

address-parse

🌏对国内地址地区进行智能解析，提取关键数据，如有识别不准的地址请Issues

Language:JavaScriptMIT000

addressparser

中文地址提取工具，支持**三级区划地址（省、市、区）提取和映射，支持地址热力图绘制。

Language:PythonMIT000

AreaCity-JsSpider-StatsGov

省市区县乡镇三级或四级城市数据，带拼音标注、坐标、行政区域边界范围；2021年03月21日最新采集，提供csv格式文件，支持在线转成多级联动js代码、通用json格式，提供软件转成shp、geojson、sql、导入数据库；带浏览器里面运行的js采集源码，综合了中华人民共和国民政部、国家统计局、高德地图、腾讯地图行政区划数据

Language:JavaScriptMIT000

Chinese-BERT-wwm

Pre-Training with Whole Word Masking for Chinese BERT（中文BERT-wwm系列模型）

Apache-2.0000

chineseocr_lite

超轻量级中文ocr，支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M

Language:C++GPL-2.0010

crfpp

CRF++: Yet Another CRF toolkit

NOASSERTION000

d2l-en

Interactive deep learning book with multi-framework code, math, and discussions. Adopted at 300 universities from 55 countries including Stanford, MIT, Harvard, and Cambridge.

NOASSERTION000

d2l-zh

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被55个国家的300所大学用于教学。

Apache-2.0000

data-science-competition

该仓库用于记录作者本人参加的各大数据科学竞赛的获奖方案源码以及一些新比赛的原创baseline. 主要涵盖：kaggle, 阿里天池，华为云大赛校园赛，百度aistudio，和鲸社区，datafountain等

000

deeplearning-models

A collection of various deep learning architectures, models, and tips

Language:Jupyter NotebookMIT010

flair

A very simple framework for state-of-the-art Natural Language Processing (NLP)

NOASSERTION000

HanLP

中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现关键词短语提取自动摘要文本分类聚类拼音简繁转换自然语言处理

Apache-2.0000

HarvestText

文本挖掘和预处理工具（文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等），无监督或弱监督方法

MIT000

JioNLP

中文 NLP 预处理工具包，准确、高效、易用 A Chinese NLP Preprocessing Package

Apache-2.0000

learn-nlp-with-transformers

we want to create a repo to illustrate usage of transformers in chinese

000

NLP-Series-NewWordsMining-PTMPretraining

NLP实验：新词挖掘+预训练模型继续Pre-training

000

Awesome multilingual OCR toolkits based on PaddlePaddle （practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices）

Language:PythonApache-2.0010

lumin115

lumin115's repositories

Blog

PaddleNLP

address-parse

addressparser

AnyText

AreaCity-JsSpider-StatsGov

Chinese-BERT-wwm

chineseocr_lite

crfpp

d2l-en

d2l-zh

data-science-competition

deeplearning-models

flair

gensim

HanLP

HarvestText

JioNLP

learn-nlp-with-transformers

NLP-Series-NewWordsMining-PTMPretraining

OCR-Corrector

PaddleOCR

PatrickStar

pyhanlp

sentence-transformers

Statistical-Learning-Method_Code

torchkeras

transformers

VIMER

yolov5