通讯员徐湘颖
大家或许都有过这样的经历:看着气象预报显示无雨,于是放心出门,却被突如其来的大雨淋成了落汤鸡,这似乎在暗示天气预报并非总是准确无误。那么,有没有一款能精准预测天气的软件呢?我校由羿旭辉、张欣宇、黄亚琳组成的本科生团队,在这一领域成功实现了重大突破。他们精心设计了一款基于深度学习的 QRPITS 模型,该模型能够更迅速、更精准地预测空气质量。
团队所完成的 “中国城市空气质量预测研究:基于 CPO - ICEEMDAN 时序分解和 QRPITS 的深度学习模型” 项目,在第十届全国大学生统计建模大赛中荣获国家级一等奖。此次获奖刷新了学校在该赛事的历史最佳成绩,同时也意味着团队在继获得美国国际大学生数学建模竞赛一等奖、全国大学生数学建模大赛一等奖之后,达成了赛事 “大满贯” 的壮举。
艰难起步 假期不停歇
“刚开始的时候,外文文献基本看不懂,我们就一点点地查阅,努力学习专业术语,不停地翻书寻找术语之间的关联。” 羿旭辉说道。团队对 1990 年以来有关预测模型的前沿文献进行了全面查阅,深入了解其发展历程与运作原理,并细致分析以往模型计算冗余、效率低下的原因。不仅要理解概念,数据的可视化分析同样至关重要,因为高级图表能够直观地呈现数据的分解效果。分解效果良好时,会呈现出明显的波动差异,有的波动幅度大,有的波动幅度小。
“过年的时候,我们连续十几天都在查阅艾斯维尔、顶级会议上的论文,观看 B 站、YouTube 上的教程,学习使用 Origin 软件绘制高级图表。” 羿旭辉回忆道。年夜饭桌上,团队成员还在群里互相答疑、热烈讨论;在全家人一起数新年倒计时、观看春晚的欢乐时刻,他们依然在忙着查阅论文、绘制图表。
正是在这连续十几个日夜的不懈学习中,羿旭辉有了新的发现。他注意到了在第十二届 ICLR 会议上提出的预测模型 Patchtst(SOTA 模型),并且发现该模型在处理具有强非线性和波动性特征的空气质量时序数据时表现卓越。由于这些数据存在一定的波动规律,所以预测未来的空气质量变化是可行的,而 PatchTST 能够以分段、独立的方式处理时间序列数据,保留了数据的局部特征。这一特性恰好与团队对空气质量预测模型的需求相契合,羿旭辉迅速将这一想法分享给队友,为模型的创新设计打下了坚实基础。
精心打磨 优化模型得精准结果
在实际应用中,团队察觉到 Patchtst 模型存在计算冗余问题。羿旭辉解释道:“比如春节和中秋期间,空气中污染物浓度常较高,但这两个节日相隔数月,彼此排放量并无直接关联。” 这种长期跨度内的相关性在时间序列分析中易引入冗余计算,增加模型复杂度。
于是,团队提出 PITS 模型,通过剔除冗余计算,迈出模型优化的关键第一步。首次测试时,PITS 模型计算速度缩短至 5 秒,预测准确率提升至 0.98,这极大地鼓舞了团队信心。
为进一步提高预测准确度,羿旭辉引入 CPO - ICEEMDAN 时序分解。就像拆解复杂的交响乐曲,使不同乐器旋律独立呈现,让听众能更专注聆听。将其应用于空气质量数据时,可有效分解数据不同成分,如短期波动和长期趋势等,帮助模型精准挖掘隐藏规律。羿旭辉形象地说:“这就像准备大餐,时序分解要先把食材分门别类,再进行加工烹饪。”
团队在模型优化上精益求精,引入分位数回归损失函数(QR),使 PITS 模型 “升级” 为 QRPITS 模型。与之前模型相比,QRPITS 模型不仅能有效预测整体趋势,还能捕捉数据中的不确定性,让预测结果更稳定可靠。它就像出色的乐队指挥,既要把控整体节奏,又要留意每个乐器的细微变化。羿旭辉表示:“分位数回归的加入,使模型在不同情境下能更精准处理空气质量数据中的波动和突发情况,提高预测结果可靠性。”
把数据输入模型后,经多层细化分解与计算,QRPITS 模型能快速得出准确预测结果。QRPITS 模型在理论研究和实际应用中都表现出色。对近 9 年空气质量数据预测中,其准确度高达 0.9999。与 PatchTST 相比,平均误差降低 21.09%,计算时间减少 66.17%。
通过 CPO - ICEEMDAN 时序分解和 QRPITS 模型,城市仿佛有了 “空气指挥家”,能更准确、及时地预测空气质量变化。这有利于政府部门提前做好应对措施,保护敏感人群。羿旭辉补充:“每年数以百万计的人受空气污染危害,我们希望这个模型为绿色科技提供新方案,守护人们健康和地球环境。”
此外,QRPITS 模型应用范围不限于空气质量预测,在车流量、金融股票等具有时序性数据的领域同样有参考价值。羿旭辉微笑着说:“只要数据具有时序性,我们的模型都可以进行预测。”
团结协作 分工明确铸就项目辉煌
作为队长,羿旭辉肩负重任。为了深入理解模型,他积极向外寻求帮助。在一次乒乓球比赛中,他结识了理学院统计专业研究生肖浩逸,羿旭辉将空气质量预测模型的想法告诉了他,收获了许多关于模型优化的宝贵建议,了解到最新的研究进展、基础模型以及统计学知识的应用等,这些都为团队后续的工作带来了大量创新灵感。
除了创新的模型,团队的成功也离不开成员之间的默契协作。每当队友对某个概念存在疑惑时,羿旭辉总是耐心地为他们答疑解惑,详细解释概念的含义与内在联系,协助队友完善各自负责的论文部分。团队成员的共同努力让整个项目日臻完善。
到了答辩阶段,团队每天都一起进行模拟答辩。黄亚琳负责讲解 PPT,羿旭辉和张欣宇则模拟评委提问。羿旭辉会提前准备好评委可能问到的问题,并指导黄亚琳如何在有限的时间内清晰地阐述项目内容。
在一次次竞赛中,这个团队战胜了来自全国乃至全球各个高校的众多团队,在数百万参赛者中脱颖而出,不断晋级。一个个一等奖点燃了团队对数学建模的热情,也让团队成员愈发自信、勇敢地迎接新的挑战。