datawhalechina / hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于2.3.1任务1中参考答案的疑惑

xby-233 opened this issue · comments

问题:

2.3.1任务1中(4)将连续变量Age按10% 30% 50% 70% 90%五个年龄段,并用分类变量12345表示,在参考答案中若设置结尾比例为0.9,则新加入的Age_bin即分类标签列会出现空值

此处提供2种思路:

  1. [0,0.1,0.3,0.5,0.7,0.9]改为[0,0.1,0.3,0.5,0.7,0.9,1],分组改为6组,即labels = range(1,7);
  2. 改为[0,0.1,0.3,0.5,0.7,1.0],分组仍为5组