---- 推薦相關內容一直是我們所持續改良及關注的閱讀體驗之一,此題目為邀請所有參賽者根據個人興趣及近期瀏覽之行為,針對瀏覽者之後的行為進行預測,推薦閱讀相關內容。 Article Recommendation
訓練資料集
-
瀏覽紀錄
- 資料說明: 參賽者可以利用此6個月份歷史資料集來設計推薦模型,並且資料是採樣過的。
- Date : 2015/03 ~ 2015/08
- Schema Description
- Sample File
- 完整資料集
-
全文資料集
- 資料說明: 此資料集之中提供這些 URL 所包含的本文資料
- Date : 2015/03 ~ 2015/08
- Schema Description
- Sample File
- 完整資料集
待測使用者(Cookie)列表
- 資料說明: 待預測的Cookie(使用者)列表,參賽者必須根據這些Cookie(使用者)的歷史閱覽紀錄,來預測會再看哪些Author(創作者)
- Date : 2015/03 ~ 2015/08
- Schema Description
- Download Link
評分方式
演算法推薦結果(70%)
-
採用 Top-N Recommendation Precision and Recall 作為指標,故採用F1 Socre來作為最終的 Score 指標
-
定義如下:
-
P : 根據過去歷史資料(訓練資料集)產生 Author(創作者) 推薦模型,再利用此模型來針對每一個 Cookie 推薦 Top-N Author 集合及為 P,而N 的大小會根據不同的使用者(Cookie) 而不同
-
R : 在測試資料集中(測試資料集) ,每一個Cookie 所瀏覽過的 Author(創作者) 集合即為 R
-
演算法推薦分數 : 採用 Min-max 標準化將 F1 Measure 進行轉換
-
-
上傳預測結果取得 F1 Score
- 上傳格式範例檔
- [上傳網址] (https://pixnethackathon2016.events.pixnet.net/score/)
- 前三名隊伍的分數將會顯示在 網站的 Leader Board 之中
簡報分數(30%)
- 簡報內容
- 演算法設計
- 資料解釋及分析
總分計算 : Final Score = (0.7 x 演算法推薦分數) + (0.3 x 簡報分數)
備註:
- 由於本站資料非常龐大,故抽樣部份資抖
- 為確保比賽順暢,詳細規則主辦單位保留細節微調之權利
相關參考資料
說明影片
小工具
- 方程式 Gif 產生器
- smaple code :
\frac{\left | P\cap R \right |}{\left | P \right |}
- sample code :
F_1 = 2 \cdot \frac{\mathrm{precision} \cdot \mathrm{recall}}{\mathrm{precision} + \mathrm{recall}}
- sample code :
score70 = 70\times \frac{X-L}{H-L}
- smaple code :