第二章第一节数据清洗及特征处理
Summerfat opened this issue · comments
Summerfat commented
for循环,numpy.map转换对文本变量进行转换,构造映射时,.nunique()函数里的参数dropna应该是False
for feat in ['Cabin', 'Ticket']:
label_dict = dict(zip(df[feat].unique(), range(df[feat].nunique(dropna=False))))
df[feat + "_labelEncode"] = df[feat].map(label_dict)
不然的话,'Cabin'的C148这里会返回一个NaN值