soramugi / twordtag

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

tag抽出の精度向上

soramugi opened this issue · comments

tagの精度向上を目指して

名詞になっているがひらがな1文字も名詞に含まれる場合があるので
tagの概念を決めておく必要があるのでポリシーやワークフローを確立

tag一つで妄想できるのがベスト。

「お」「さ」とかが表示されても面白みが無い。
「姉ちゃん」「パンツ」とか物の名前や想像する事が出来るものが表示されているように整える。
「この人断食の事ばっかり5回もつぶやいてたんだ...」とかなると良い。

ひらがな1文字や「http」のtag作成はしない方がいいかもしれない。

cc1efe1
httpとひらがな1文字の作成しないコミット済み

あとは気づいたら改修していくとかしていかないと切りがなさそう..