2019年寒假,突发的“新冠肺炎”疫情,让许多人原本的时间安排与计划付诸东流。每天新增确诊、治愈、死亡、疑似人员的数字与走势,牵动着全国上下每个人的心。大家都盼着疫情早日结束,我们能尽快回归正常的生活,让推迟的学习、工作计划早点提上日程。
美国大学生数学建模竞赛(简称美赛),是唯一的国际性数学建模竞赛,也是世界范围内最具影响力的数学建模竞赛。竞赛组委会在2020年1月28日发布消息,本届“美赛”决定为因疫情影响的参赛学生加赛一场,在原定2月13日-17日的时间段基础上,增加3月5日-9日的另一个赛段。
参加过数学建模实战的人都知道,三四天的时间内,要对一个复杂的数学问题形成一份逻辑严谨、证明充分、叙述清晰、数据可视化程度较高的论文,需要团队内三人密切配合、高强度连续作业,才有可能得到好的结果。这对团队内三名队员的沟通效率具有较高要求,最好的方式当然是可以面对面交流的线下比赛。但由于新冠疫情的影响,对于要参加本次美赛的中国同学来说,这是不现实的。
由kok体育 17级自动化专业卓越班杨嵩林、电气工程及其自动化专业杨雪凡和计算机科学与技术专业李浩然三名同学组成的“屠龙小分队”,面对基本不可能如期开学的局面,决定参加第二场比赛。大家都希望:也许那时候就开学了。大家每天起床第一件事就是查看有无“开学”消息。直到江苏省发布了“三月开始开展线上教学”的通知,彻底浇灭了团队在第二场比赛时间段汇合参赛的希望。
为了更好地了解各自的备赛进度,队员决定寒假队内集训期间,每天晚上“九点半”线上开会,讨论遇到的问题,汇报各自的进度。这既能够增强互相之间的联系,也能够起到互相督促的作用。假如今天没好好“努力学习”,晚上就没法给另外两个人交代了。
团队队员经过讨论、咨询指导老师,选定的题目类型是“美赛”为了紧跟这几年“数据分析与挖掘技术”潮流而新增的MCM Problem C“大数据”题。选这道题队员冒了很大风险,这个方向是最新的学术方向,可参考的资料少之又少,入门不易。杨嵩林同学作为团队整体建模方案的负责人,积极与指导教师袁泉老师沟通。虽然袁老师很耐心也很热心,但是要切实提高自己数据挖掘的水平,还得靠队员自己。队员们根据袁老师的建议,从最基础的怎样进行数据统计量分析和预处理入手,学习了大量文献资料,每天“混迹”在知网、知乎、CSDN以及一切可能回答参赛中各种问题的平台。从最常用的随机森林、支持向量机、元胞自动机模型到神经网络、遗传算法、蚁群算法等现代优化算法,基于工程思维,队员们可能没有把里面每个数学推导弄明白,但各种算法的“输入-输出”、数据类型的特点以及实际应用案例,他们都做了大量学习、归纳、整理、积累工作。
因为团队制定的备赛策略针对性较强,第一天其他团队还在选题上纠结的时候,“屠龙小分队”就结束了赛题讨论及第一版模型方案的建立。今年的MCM C题,最大的难点就是Natural Language Processing(自然语言处理)。乍一看到数据类型的时候,让作为队长的杨嵩林有点懵,而负责编程和数据处理的同学也说这是他们的“技能盲点”,这无疑增加了完赛的难度。
针对这样的情况,团队经过紧张的线上讨论做出方案规划,通过查阅大量有关“在线评论情感分析”资料,结合之前对各种分类器优缺点的分析以及“编程手”的工具储备,制定了更适合该题目的、大大减少难度同时又能充分满足分析要求的“自然语言处理”方案。第一天,队员们把最大的坎迈了过去。
后面三天就是一个不断遇到问题又不断解决问题的“拉锯战”。只不过,如果是面对面,队员们可以在硬件条件上实现无障碍交流。现在,因为疫情被迫“云建模”,队员们四天时间内,除了正常的休息,就是保持电话会议在线,要图表、要思路、要解释,随时开麦连线TA。如果方案不明白那就开白板,画图解释。一起改摘要,修改论文,就共享屏幕,三个人一字字审核。
2020年3月10日凌晨3:13,当点下“发送”键,压在队员们心中一块大石头终于放下了。提前3个多小时提交论文,宣告这场基于“云建模”模式的“美赛”之旅落下帷幕。三个人准备了一个寒假,又顶着身体与心理双重压力熬过了四天三夜。队员们收获的,不仅仅是一次比赛体验,各自能力的进阶与成长,更是特殊情形下的对同学们综合素质的历练和考验。
预祝“屠龙小分队”能够取得优异的成绩!