Alex-CHUN-YU / N-gram_Application

透過 Cosine 相似度計算文件(Vector)與文件(Vector)之間關聯性匹配,向量表達 Value 方式為 TF

Home Page:https://en.wikipedia.org/wiki/Cosine_similarity

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

N-gram-Application

demo

透過 N-gram 生成詞彙並利用 Bag of Word 表達文件向量方式, 進行 cosine 找出最相似的文件

使用方式

Input:

1.執行 Main.py 並輸入以下類似之句子(EX:如果我不想使用預借現金服務,如何辦理?)
2.可到 CTBC.json 中的資料集尋找句子修改做測試。

Output:

以下為可能回覆的答案:
您可隨時致電本行客服專線0800-024-365按1輸入個人資料後按9轉接客服人員,即可立刻為您線上關閉預借現金功能。

開發環境

Python 3.5.2
pip install json
pip install scipy

About

透過 Cosine 相似度計算文件(Vector)與文件(Vector)之間關聯性匹配,向量表達 Value 方式為 TF

https://en.wikipedia.org/wiki/Cosine_similarity


Languages

Language:Python 100.0%