pixnet / 2016-pixnet-hackathon-recommendation

2016-pixnet-hackathon-recommendation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Article Recommendation

---- 推薦相關內容一直是我們所持續改良及關注的閱讀體驗之一,此題目為邀請所有參賽者根據個人興趣及近期瀏覽之行為,針對瀏覽者之後的行為進行預測,推薦閱讀相關內容。

訓練資料及測試資料的示意圖如下

訓練資料集

待測使用者(Cookie)列表

  • 資料說明: 待預測的Cookie(使用者)列表,參賽者必須根據這些Cookie(使用者)的歷史閱覽紀錄,來預測會再看哪些Author(創作者)
  • Date : 2015/03 ~ 2015/08
  • Schema Description
  • Download Link

評分方式


演算法推薦結果(70%)

  • 採用 Top-N Recommendation Precision and Recall 作為指標,故採用F1 Socre來作為最終的 Score 指標

  • 定義如下:

    • P : 根據過去歷史資料(訓練資料集)產生 Author(創作者) 推薦模型,再利用此模型來針對每一個 Cookie 推薦 Top-N Author 集合及為 P,而N 的大小會根據不同的使用者(Cookie) 而不同

    • R : 在測試資料集中(測試資料集) ,每一個Cookie 所瀏覽過的 Author(創作者) 集合即為 R

    • Precsion 定義 :

    • Recall 定義 :

    • F1 Measure 定義 :

    • 演算法推薦分數 : 採用 Min-max 標準化將 F1 Measure 進行轉換

      • H : 所有隊伍中最高分的 F1 Measure 即代表 H
      • L : 所有隊伍中最低分的 F1 Measure 即代表 L
      • X : 某隊中所上傳中的最高 F1 Measure 即代表 X
  • 上傳預測結果取得 F1 Score

簡報分數(30%)

  • 簡報內容
  • 演算法設計
  • 資料解釋及分析

總分計算 : Final Score = (0.7 x 演算法推薦分數) + (0.3 x 簡報分數)

備註:

  • 由於本站資料非常龐大,故抽樣部份資抖
  • 為確保比賽順暢,詳細規則主辦單位保留細節微調之權利

相關參考資料

說明影片

小工具

  • 方程式 Gif 產生器
    • smaple code :\frac{\left | P\cap R \right |}{\left | P \right |}
    • sample code : F_1 = 2 \cdot \frac{\mathrm{precision} \cdot \mathrm{recall}}{\mathrm{precision} + \mathrm{recall}}
    • sample code : score70 = 70\times \frac{X-L}{H-L}

About

2016-pixnet-hackathon-recommendation


Languages

Language:Jupyter Notebook 100.0%