ZhuiyiTechnology / simbert

a bert for retrieval and generation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

> 可以用PCA降维,参考:https://kexue.fm/archives/8069

DaiJitao opened this issue · comments

可以用PCA降维,参考:https://kexue.fm/archives/8069

好的,我后续试一下这个PCA降维度。
我目前做了一个实验,就是上面截图那样,下载了bert4keras源码,然后新增了一个Dense层,强制把维度修改为300了,然后我在自己的语料上fineturn了一下,计算cos相似度,对同一个句子对,前后对比发现整体cos值变高了

Originally posted by @TestNLP in #11 (comment)

cos需要输入句子1和句子2的向量吧?才能计算余弦相似度。不明白的地方在于,句子1的向量是直接通过simbert获取的吗?句子2的向量也是通过simbert获取的吗?请问句子1和句子2的向量是如何获取的?