我参加数学建模从19年7月开始,在学校培训然后参加校赛
校赛中我们的题目是**人口发展态势预测
我在3天时间内快速学习了适用于预测类问题的Logistic模型预测了未来15年的人口数量。还学习了GM灰色预测模型,根据2000-2015年数据预测了2016-2031年的人口数据。
国赛中我们选的是C题
题目是基于决策树与概略控制优化模型下的机场出租车问题分析
在这次比赛中我负责的是:
数据搜集与数据清洗:从微软亚洲研究院网址获取北京 2018 年 2 月的出租车轨迹数据,使用 python 将 txt 数据转成 csv 格式并获取指定日期的数据,计算数据中两个坐标点的距离;
➢ 数据可视化:使用 Arcgis 将数据点在北京机场的地图上显示出来,可视化租车在机场附近的车流量地图;
➢ 模型建立:建立决策树模型,通过比较“等待载客”与“直接放空返回市区拉客”两种状态下司机处于不 同等待时长中的预期收益来制定效益最大化的决策;
➢ 撰写论文:整理数据结果和分析过程撰写论文报告,使用 Latex 将论文全文进行排版。
因为疫情原因比赛分为了2月和3月,我们2月份的比赛作为模拟。
二月份我们选择的是A题
我负责的是
➢数据和资料搜集:找到了50年的全球SST(海表面温度)数据,使用Arcgis将温度数据在全球地图上显示出来。根据所研究鱼的活动范围,确定研究范围。
➢建立模型和求解:使用层次分析法来求出四个影响因素(利润、环境、成本、迁移捕鱼地)对决策的影响
➢构建判断矩阵并求解出各个因素的权重
➢ 撰写论文:整理数据结果和分析过程撰写论文报告,使用 Latex 将论文全文进行排版。
➢数据处理:将tsv格式的数据转成csv格式,使用excel对数据进行处理
➢ 数据可视化:使用excel处理数据,做出三种商品2005-2015年的折线图和柱状图
➢ 模型建立和求解:
完成第二大问的四五小问模型的建立、求解和论文撰写
第四小问标题为 Do specific star ratings incite more reviews?
探究特定的评论星级是否会影响其他用户评价的内容
我使用了典型相关分析的方法分析
结果表明,RAS和K两个指标之间只有一对典型变量。一般而言,通过对典型相关变量的分析,可以得出结论,顾客评价的内容将受到先前订单星级的影响。
第五小问标题为 Is the comment content related to the rating level?
探究评论的内容是否会影响评论的星级,我先对数据进行了描述统计。
然后使用excel处理数据做出了Pacifier产品评论类型和星级的百分比柱状图。然后使用Spss计算出了各个星级的矩阵散点图。最后计算不同星级之间的Pearson相关系数,求出了它们之间具有一定的正相关性。
➢ 撰写论文:整理数据结果和分析过程撰写论文报告,使用 Latex 将论文全文进行排版。