交通状态估计在交通控制和运营中起着重要作用,因为它可以为没有完全观测或存在缺陷交通数据的位置提供准确且高分辨率的交通估计。近年来,有几篇综述论文总结了传统的基于物理模型和纯数据驱动方法在交通状态估计中的应用,并发现这两种方法在准确建模交通状态方面都存在局限性。因此,最近广泛发展了一种基于物理模型和机器学习相结合的混合方法来克服这个问题。然而,目前对于混合物理-机器学习方法在交通状态估计中的具体挑战和研究空白还没有清晰的认识。在本文中,我们对现有的基于混合物理-机器学习方法解决交通状态估计问题的研究进行了全面调查。这项调查使我们发现了当前研究的固有挑战和空白。研究结果对于评估基于混合物理-机器学习的交通状态估计方法的适用性以及确定未来研究方向具有深远的意义。https://academic.oup.com/iti/advancearticle/doi/10.1093/iti/liad002/7153051本调查的主要目标是全面系统地总结基于混合物理-机器学习方法,提供对最新和先进方法的更好理解,并找到交通状态估计领域未来的潜在研究方向。本文的另一个目标是为不同情况下决定应该使用何种TSE方法提供基础知识。需要注意的是,每种TSE方法都有其自身的优点和不足,适用于特定的现实应用。据我们所知,尚未有关于基于混合物理-机器学习方法用于交通状态估计问题的综合调查。我们希望本次调查对于那些有兴趣探索在各自领域中利用基于混合物理-机器学习来提高建模性能的科学家也能有所价值。
图1 基于物理模型、基于模型驱动和基于混合物理-机器学习方法
混合物理-机器学习模型的关键组成部分是物理模型损失函数,它能够将物理差异融入标准损失函数中,使模型预测不仅在训练集上显示较低的误差,而且与未标记集上已知的物理知识具有科学一致性。经典的物理模型损失函数描述如下:其中,训练损失Loss(Y, Y ̂) 用于衡量标签Y和预测Y ̂ 之间的经验误差(例如均方误差);Loss(Y ̂) 表示物理不一致性(也称为基于物理的损失),旨在保持预测与物理定律的一致性。R(f) 表示模型结构误差,用于衡量模型的复杂性;α、β 和 λ 分别代表经验误差、结构误差和物理不一致性的权衡超参数。1.在现有文献中,只有有限类型的基于混合物理-机器学习模型得到了发展。值得构建多种基于混合物理-机器学习模型的范式。例如,将不同的物理模型整合到各种机器学习模型中。此外,值得研究不同范式对交通状态估计性能和学习稳定性的影响。
2.基于混合物理-机器学习方法很少用于改进交通状态预测的性能。值得将物理知识引入机器学习模型,以提高交通状态预测性能。
3.近年来,利用连接自动化车辆环境的数据已经引起了重大关注,开发能够整合连接自动化车辆环数据用于交通状态估计的更先进的基于混合物理-机器学习模型,将对未来研究实际应用连接自动化车技术的领域具有重要价值。
4.对于不规则拥堵情景或交通拥堵预测而言,这是交通领域中更困难的问题,基于混合物理-机器学习方法具有巨大潜力,因为它可以解决深度学习模型的一些缺点。基于混合物理-机器学习方法对缺失数据、噪声、过拟合具有更强的鲁棒性,并且可能有助于使深度学习模型更具可解释性。