datawhalechina / hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

第二章第一节数据清洗及特征处理

Summerfat opened this issue · comments

for循环,numpy.map转换对文本变量进行转换,构造映射时,.nunique()函数里的参数dropna应该是False
for feat in ['Cabin', 'Ticket']:
label_dict = dict(zip(df[feat].unique(), range(df[feat].nunique(dropna=False))))
df[feat + "_labelEncode"] = df[feat].map(label_dict)

不然的话,'Cabin'的C148这里会返回一个NaN值