记录CCF系统认证比赛
- 比赛地址:https://www.datafountain.cn/competitions/537/datasets
- 比赛数据是从竹云的风险分析产品日志库中摘录而来,主要涉及认证日志与风险日志数据。比赛数据经过数据脱敏和数据筛选等安全处理操作,供大家使用。其中认证日志是用户在访问应用系统产生的行为数据,包括登录、单点登录、退出等行为。
- 本次比赛是个二分类问题,主要判断风险是否存在?
- 所用模型是Lightgbm,通过分组构建了一些系统登录相关的统计特征,效果不是很好,勉强能做到0.520左右的auc。但比赛中自己手动实现了auc的计算(在code文件夹下的baseline.py里面),认真看了下Lightgbm的原理,总算还是有收获的。
最后,如果感觉对您有用的话,麻烦star下哦!!!