fanfannothing / simpler_glove

A Simpler GloVe model for distributed word representation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Simpler GloVe: A Simpler Model for Word Representation from Glove

以互信息为训练目标的词向量模型。

2017.12.16更新:提供多种模型组合

0:上下文向量和中心词向量共用一组词向量,这种词向量在语义捕捉方面效果会比较好;

1:上下文向量和中心词向量用不同的词向量,每个词的向量为两种向量的直接拼接,这种词向量会在语法任务上比较好;

2:上下文向量和中心词向量用不同的词向量,每个词的向量为两种向量的求和,这种词向量表现应该跟0类似。

Oringal glove model: https://github.com/stanfordnlp/GloVe

相比原版glove:修改了cooccur.c和glove.c两个文件。

更别致的词向量模型(一):simpler glove

更别致的词向量模型(二):对语言进行建模

更别致的词向量模型(三):描述相关的模型

更别致的词向量模型(四):模型的求解

更别致的词向量模型(五):有趣的结果

更别致的词向量模型(六):代码、分享与结语

Train word vectors on a new corpus

$ git clone https://github.com/bojone/simpler_glove
$ cd simpler_glove && make
$ ./demo.sh

About

A Simpler GloVe model for distributed word representation

License:Apache License 2.0


Languages

Language:C 70.3%Language:Python 17.2%Language:MATLAB 10.8%Language:Shell 0.9%Language:Makefile 0.8%