PandasCute / 2018-ORANGE-FINANCIAL-BIG-DATA-top9

2018年甜橙金融杯大数据建模大赛-初赛第四-复赛线上11-决赛9-复现top1解决方案-【二分类,风控】

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

2018-ORANGE-FINANCIAL-BIG-DATA-top9

2018-2018年甜橙金融杯大数据建模大赛-初赛第四-复赛线上11-决赛9-复现top1解决方案

=================================================================================
赛题链接
赛程时间:2018.10.20-2018.12.14
队名:火锅肠粉烤鸭
参与人狗头哥wangjx小兔子乖乖
百度云盘下载链接:为避免数据丢失,提供数据集下载地址链接:

1.1数据说明 操作详单数据字典

字段名 中文解释 字段说明
UID 用户编号 /
day 操作日期 连续的日期标识,E.g,1为第一天,2为第二天,以此类推
mode 操作类型 操作类型(例如:修改密码、查询余额...)
success 操作状态 /
time 操作时间点 /
os 操作系统 /
version 客户端版本号 /
device1 操作设备参数1 设备名称加密,原字段加“Jack's iphone”
device2 操作设备参数2 设备型号
device1 操作设备唯一标识1 设备号唯一标识加密,可用于安卓类设备的唯一标识
device2 操作设备唯一标识2 设备号唯一标识加密,可用于安卓类设备的唯一标识
mac1 MAC地址 操作设备MAC地址编码加密,原字段如“38:XX:XX:XX:XX:92”
ip1 ip地址 操作设备IP地址编码加密
ip2 ip地址 操作电脑IP地址编码加密
device_code3 操作设备唯一标识3 设备号唯一标识加密,可用于苹果类设备的唯一标识
mac2 mac地址 WIFI MAC地址编码加密,原字段如“02:XX:XX:XX:XX:03”
wifi WIFI名称 WIFI名称,原字段“A的wifi”
geo_code 地理信息 经纬度GeoHash编码
ip1_sub IP地址 前三位操作设备IP地址编码加密(ip前三位IP地址)比如,原字段为12,34,56,7和12,34,56,8的ip地址前三位都为12,34,56,故脱敏后的值是一样的
ip2_sub ip地址 前三位操作电脑IP地址编码加密(ip2前三位IP地址)

1.2数据说明 交易详单数据字典

字段名 中文解释 字段说明
UID 用户编号 /
channel 平台 平台类型
day 交易日期 连续的日期标识,1为第一天,2为第二天,以此类推
time 交易时间点 /
trans_amt 脱敏后交易时间点 /
amt_src1 资金类型 交易资金源类型,例如“金额”、“银行卡”
merchant 商户标识 商户编码加密
code1 商户标识 商户子门店编码加密
code2 商户终端设备标识 商户交易终端设备编码加密
trans_type1 交易类型1 交易类型,例如“消费” “退款”
acc_id1 账户相关 用户交易账户号编码加密
device_code1 操作设备唯一标识1 设备号唯一标识加密,可用于安卓类设备的唯一标识
device_code2 操作设备唯一标识2 设备号唯一标识加密,可用于安卓类设备的唯一标识(唯一标识并不会只是一种 但都能达到效果)
device_code3 操作设备唯一标识3 设备号唯一标识加密,可用于苹果类设备的唯一标识
device1 操作设备参数1 设备名称加密,原字段如“Jack's iphone”
device2 操作设备参数2 设备类型
mac1 MAC地址 操作设备MAC地址编码加密,原字段如“38:XX:XX:XX:XX:92”
ip1 IP地址 操作设备IP地址编码加密
bal 脱敏后账户余额 保留大小关系
amt_src2 资金类型 交易资金源类型,与1类型相似,2对银行卡做了细分
acc_id2 账户相关 转账操作的转出账户号编码加密
acc_id3 账户相关 转账操作的转入账户号编码加密
geo_code 地理信息 经纬度GeoHash编码
trans_type2 交易类型2 交易类型,例如“线上”、“线下”trans_type2与trans_type1的维度和侧重点不同
market_code 营销活动号编码 营销活动号编码加密
market_type 营销活动标识 营销活动类型
ip1_sub IP地址 前三位操作设备IP地址编码加密(ip1前三位IP地址)

2.配置环境和依赖库

  • python3
  • sklearn
  • python notebook

3.代码运行步骤说明

首先运行

1.dx_base_drop_black_list.ipynb
2.submission.ipynb

4.特征工程

5.模型训练

About

2018年甜橙金融杯大数据建模大赛-初赛第四-复赛线上11-决赛9-复现top1解决方案-【二分类,风控】

License:MIT License


Languages

Language:Jupyter Notebook 100.0%