upura / nhk-for-school-pro

「NHKハッカソン- 教育×シビックテック×ニュース」での成果物です

Home Page:https://nhk-hackathon.peatix.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

NHK for School Pro

Development

python3 -m venv env
source env/bin/activate
pip install -r requirements.txt
streamlit run nhk_hackathon/app.py

Env

.env ファイルは、下記の情報を含みます。

WEBURL=https://XXXXXXXXXXXXXXX
WEBKEY=XXXXXXXXXXXXXXX
SCHURL=https://XXXXXXXXXXXXXXX
SCHKEY=XXXXXXXXXXXXXXX

Flow

  1. ユーザから検索語を受け取る
  2. 検索語を含む「NHK for School」の動画クリップを一つ表示
  3. 表示した動画クリップのタイトルや説明文を形態素解析ツール「MeCab」で処理し、名詞部分を「キーワード」として抽出(各キーワードは「TF-IDF」で重要度を計算しておく)
  4. それぞれの名詞で「NHK NEWS WEB」の記事を検索し、重複を排除した記事群を「関連記事」とする
  5. 関連記事は、各記事に含まれるキーワードを用いてスコア付けし、降順で表示

Developers

About

「NHKハッカソン- 教育×シビックテック×ニュース」での成果物です

https://nhk-hackathon.peatix.com/

License:MIT License


Languages

Language:Python 100.0%