PMI计算
daisz97 opened this issue · comments
您好!请问您代码中在计算PMI的W(i,j)的时候是不是忘记考虑同一个window中可能存在相同word_pair的情况(line408-428)了?因为如您所说#W(i,j) is the number of “sliding windows” that contain both word i and j,而不是word_pair (i,j) 本身出现的次数。不知道我的理解有没有问题,谢谢您!
您好!是的,后来我发现了,因为论文已经最终版了,就没有修改。我试过: 一个窗口如果包含相同的word_pair, 只算一次,最终实验效果和论文中很接近。
@yao8839836
好的,谢谢