mgq1507 / ccf_system_identify

记录CCF系统认证比赛的代码

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ccf_system_identify

记录CCF系统认证比赛

  • 比赛地址:https://www.datafountain.cn/competitions/537/datasets
  • 比赛数据是从竹云的风险分析产品日志库中摘录而来,主要涉及认证日志与风险日志数据。比赛数据经过数据脱敏和数据筛选等安全处理操作,供大家使用。其中认证日志是用户在访问应用系统产生的行为数据,包括登录、单点登录、退出等行为。
  • 本次比赛是个二分类问题,主要判断风险是否存在?
  • 所用模型是Lightgbm,通过分组构建了一些系统登录相关的统计特征,效果不是很好,勉强能做到0.520左右的auc。但比赛中自己手动实现了auc的计算(在code文件夹下的baseline.py里面),认真看了下Lightgbm的原理,总算还是有收获的。

最后,如果感觉对您有用的话,麻烦star下哦!!!

About

记录CCF系统认证比赛的代码


Languages

Language:Jupyter Notebook 98.5%Language:Python 1.5%