主要用于生成xlearn
库中FM
和FFM
两种算法需要的格式文件。主要接口函数和类在xlearn_utils.py
文件中,data
中包含了测试数据,xlearn_test.ipynb
是测试不同情况下的效果。
FMFormat
:为生成FM
所需格式文件准备类,相当于对原始文件进行统计。convert_to_fm
:生成FM
文件的接口函数。FFMFormat
:为生成FFM
所需格式文件准备类。convert_to_ffm
:生成FFM
文件的接口函数。preprocess
:对连续型特征进行归一化处理。cut_bins
:对跨度较大的连续型特征,可以选择分箱处理。