2021-iFLYTEK-LoanPredction-Top4-Solution

赛题介绍

datawhale&科大讯飞举办的学习挑战赛————“车辆贷款违约预测挑战赛” Rank4 方案

给定某机构实际业务中的相关借款人信息，包含53个与客户相关的字段，其中loan_default字段表明借款人是否会拖欠付款。任务目标是通过训练集训练模型，来预测测试集中loan_default字段的具体值，即借款人是否会拖欠付款，以此为依据，降低贷款风险。

赛题数据由训练集和测试集组成，总数据量超过25w，包含52个特征字段。为了保证比赛的公平性，将会从中抽取15万条作为训练集，3万条作为测试集，同时会对部分字段信息进行脱敏。

本次竞赛的评价标准采用 F1-score 指标。

这个比赛属于学习实践性质，比较简单。主要参考使用了@第一次打比赛大佬的baseline套路。

numpy 1.21.1

pandas 1.3.1

scikit-learn 0.24.2

lightgbm 3.2.1

tqdm 4.51.0

datawhale&科大讯飞举办的学习挑战赛————“车辆贷款违约预测挑战赛” Rank4 方案

MIT License

Language:Jupyter Notebook 100.0%