lhyxcxy / nlp

各种nlp 框架(自然语言处理)集成以及使用包括 word2vec nltk textblob crf++ 等

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

lhy-nlp

集成各种nlp框架

使用包括 word2vec nltk textblob crf++ 等

(1)机器人
(2)中文翻译,及繁体转简体
(3)关键词提取,主题提取,摘要提取
(4)命名体识别
(5)分词
(6)情感分析,正负类分析
(7)近义词,同义词,句子相似性
(8)聚类,监督,无监督
(9)词性标注
(10)词向量提取
.
├── chatbot   #########################机器人
│   ├── __init__.py
│   └── readMe.txt
├── chinese_trans ################ 中文翻译,及繁体转简体
│   ├── __init__.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── chinese_to_fanti.py
│       ├── chinese_to_pinyin.py
│       ├── __init__.py
│       └── readMe.txt
├── keywords_summary_topic  ###########关键词提取,主题提取,摘要提取
│   ├── __init__.py
│   ├── jieba
│   │   ├── __init__.py
│   │   └── keywords.py
│   ├── readMe.txt
│   ├── snowNlp
│   │   ├── __init__.py
│   │   └── keyword_summary.py
│   └── Word2vec
│       ├── deerwester.dict
│       ├── deerwester.mm
│       ├── deerwester.mm.index
│       ├── example.py
│       ├── foo.tfidf_model
│       ├── __init__.py
│       ├── lda_corpus.mm
│       ├── lda_corpus.mm.index
│       ├── lsi_corpus.mm
│       ├── lsi_corpus.mm.index
│       ├── model.lda
│       ├── model.lda.expElogbeta.npy
│       ├── model.lda.id2word
│       ├── model.lda.state
│       ├── model.lsi
│       ├── model.lsi.projection
│       ├── text1.txt
│       ├── text2.txt
│       └── text3.txt
├── named\ _entity_\ recognition #################命名体识别
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── create_corpus.py
│   │   ├── crf_model_1
│   │   ├── curpus.txt
│   │   ├── doc.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   └── train_and_test.py
│   ├── __init__.py
│   └── readMe.txt
├── participle       ########################分词
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── crf_model
│   │   ├── crf_model_1
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   ├── setp_1.py
│   │   ├── setp_2.py
│   │   ├── test_input.txt
│   │   ├── test_output.txt
│   │   └── train.data
│   ├── __init__.py
│   ├── jieba
│   │   ├── fenci.py
│   │   ├── __init__.py
│   │   ├── stopdict.txt
│   │   └── userdict.txt
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── words_sentences.py
├── sentiment_analysis ###########################情感分析,正负类分析
│   ├── __init__.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── sentiment_test.py
├── similarity    #########################近义词,同义词,句子相似性
│   ├── __init__.py
│   ├── readMe.txt
│   ├── snowNlp
│   │   ├── __init__.py
│   │   └── sentence_similarity.py
│   └── Word2vec
│       ├── __init__.py
│       ├── sentences
│       │   ├── __init__.py
│       │   ├── lsi_corpus.mm
│       │   ├── lsi_corpus.mm.index
│       │   ├── lsi_similarity.sim
│       │   ├── model.lsi
│       │   ├── model.lsi.projection
│       │   ├── mydict.dict
│       │   ├── readMe.txt
│       │   ├── sentences_similer.py
│       │   ├── train_corpus.txt
│       │   └── train.py
│       └── words
│           ├── chinesewords.txt
│           ├── corpus.txt
│           ├── create_vec.py
│           ├── __init__.py
│           ├── plot.py
│           ├── readMe.txt
│           ├── read_vec.py
│           ├── remove_stopwords.py
│           ├── stopdict.txt
│           ├── wordvec_c.model
│           └── wordvec.model
├── text_classifier  ################聚类,监督,无监督
│   ├── __init__.py
│   ├── nltk
│   │   ├── example.py
│   │   ├── __init__.py
│   │   └── readMe.txt
│   ├── readMe.txt
│   ├── sklearn
│   │   ├── data_baoxian.json
│   │   ├── data.json
│   │   ├── example_1.py
│   │   ├── example_2.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   ├── stop_baoxian.txt
│   │   ├── stopword.txt
│   │   └── test.py
│   └── textblob
│       ├── female.txt
│       ├── __init__.py
│       ├── male.txt
│       ├── readMe.txt
│       ├── test2.py
│       └── test3.py
├── word_tagging   #################词性标注
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── create_curpus.py
│   │   ├── crf_model_1
│   │   ├── curpus.txt
│   │   ├── doc.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   └── train_and_test.py
│   ├── __init__.py
│   ├── jieba
│   │   ├── __init__.py
│   │   └── word_tagging.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── test.py
└── word_vector  ######################词向量提取
    ├── __init__.py
    ├── readMe.txt
    └── Word2vec
        ├── chinesewords.txt
        ├── corpus.txt
        ├── create_vec.py
        ├── __init__.py
        ├── read_vec.py
        ├── remove_stopwords.py
        ├── stopdict.txt
        ├── wordvec_c.model
        └── wordvec.model

About

各种nlp 框架(自然语言处理)集成以及使用包括 word2vec nltk textblob crf++ 等


Languages

Language:Python 80.3%Language:Objective-C++ 11.8%Language:Ruby 7.9%