DisneyAladdin / kenkyu

修論関係

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

修論タイトル

トピックモデルにより話題集約されたノウハウサイト群の閲覧インタフェース

Keywords

Web,情報検索,検索エンジン,トピックモデル,word2vec,話題集約

所属

筑波大学 システム情報工学研究科 知能機能システム専攻

発表等

・JSAI2018(人工知能学会)
https://confit.atlas.jp/guide/event/jsai2018/subject/1E3-04/classlist

・DEIM2019(日本データベース学会)
http://db-event.jpn.org/deim2019/post/program.html

大まかな流れ

・クエリ入力
・検索エンジン・サジェスト収集
・検索結果上位20位ずつ,ウェブページを収集
・形態素解析(Mecab)
・LDAトピックモデル(教師なし学習)
・word2vec訓練(wikipedia+ウェブページ文書)
・ウェブページにタグ付く検索エンジン・サジェスト同士のCos類似度からサブトピック生成
・デモインタフェース(HTML)作成
・トピックモデルの結果に対し,SVM(Support Vector Machine)を適用,ノウハウサイトの自動同定
・同定されたノウハウサイト候補群およびデモインタフェースを入力に,「ノウハウちゃんねる」作成

Licence

CopyRight (c) 2018 Shuto Kawabata

Released under the MIT licence

https://opensource.org/licenses/MIT

Author

川畑修人

Shuto Kawabata

About

修論関係


Languages

Language:HTML 99.7%Language:Python 0.3%Language:Perl 0.0%Language:Shell 0.0%Language:CSS 0.0%