项目来源于kaggle,数据集包含10万条巴西预约挂号的就诊信息,研究病人是否如约前往医院就诊。每行数据录入了有关患者特点的多个数值,包括“预约日期 (ScheduledDay)”指患者具体预约就诊的日期;“街区(Neighborhood)”指医院所在位置;“福利保障(Scholarship)”说明病人是否是巴西福利项目Bolsa Família的保障人群;最后一列:“No”表示病人已如约就诊,“Yes”说明病人未前往就诊。
该项目是我在进行数据分析初步学习之后进行的第一个完整的数据分析项目,为完成该项目涉及到的步骤有:提出问题,数据评估/清洗,探索性数据分析,得出结论,传达结果等,所有步骤均为独立完成。
在分析过程中发现,病人能否按预约就诊与泰坦尼克号乘客能否生还有相似之处,分析方法可以相互借鉴。
kaggle数据集:
分析有不当之处欢迎指正