雨渐渐's repositories
perceptron
感知机
autospider
自动化爬虫
ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
ChineseSTS
中文文本语义相似度(Chinese Semantic Text Similarity)语料库建设
exoskeleton_armor
chains: organize work flow
fnlp
中文自然语言处理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)
HanLP
汉语言处理包 分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁 Lucene插件
incubator-brpc
Industrial-grade RPC framework used throughout Baidu, with 1,000,000+ instances and thousands kinds of services, called "baidu-rpc" inside Baidu.
Llama2-Chinese
Llama中文社区,最好的中文Llama大模型,完全开源可商用
lr
线性回归, 逻辑回归
miniseg
A Chinese Words Segmentation Tool Based on Bayes Model
ml_hmm
隐马尔科夫模型---中文分词
nlp-lang
这个项目是一个基本包.封装了大多数nlp项目中常用工具
simhash
A Python Implementation of Simhash Algorithm
similarity
similarity:相似度计算工具包,java编写。用于词语、短语、句子、词法分析、情感分析、语义分析等相关的相似度计算。
vim
a simple clone of ma6174/vim
wordnet
语义词典
zkpython_example
A simple example using zkpython