基于End-to-end深度强化学习的多车场车辆路径优化后印本

作者： 雷坤 ¹ 郭鹏 ^1,3 王祺欣 ¹ 赵文超 ¹ 唐连生 ²
作者单位：

1. 西南交通大学机械工程学院

2. 宁波工程学院经济与管理学院

3. 轨道交通运维技术与装备四川省重点实验室
提交时间：2022-05-18 16:08:24

摘要: 为提高多车场车辆路径问题(Multi-Depot Vehicle Routing Problem，MDVRP)的求解效率，提出了端到端的深度强化学习框架。首先，将MDVRP建模为马尔可夫决策过程(Markov Decision Process，MDP)，包括对其状态、动作、收益的定义。同时，提出了改进图注意力网络(Graph Attention Network，GAT)作为编码器对MDVRP的图表示进行特征嵌入编码，设计了基于Transformer的解码器。并采用改进REINFORCE算法来训练该模型。该模型不受图的大小约束，即其一旦完成训练，就可用于求解任意车场和客户数量的算例问题。最后，通过随机生成的算例和公开的标准算例验证了所提出框架的可行性和有效性。即使在求解客户节点数为100的MDVRP上，经训练的模型平均仅需2毫秒即可得到与现有方法相比更具优势的解。

多车场车辆路径问题深度强化学习图神经网络 REINFORCE算法 Transformer模型

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:202205.00136 (或此版本 ChinaXiv:202205.00136V1)
DOI:10.12074/202205.00136V1
CSTR:32003.36.ChinaXiv.202205.00136.V1
推荐引用方式： 雷坤,郭鹏,王祺欣,赵文超,唐连生.(2022).基于End-to-end深度强化学习的多车场车辆路径优化.计算机应用研究.[ChinaXiv:202205.00136] (点此复制)

版本历史

[V1]

2022-05-18 16:08:24

ChinaXiv:202205.00136V1

下载全文

相关论文推荐

1. 神经模拟推断：基于神经网络和模拟推断的认知建模方法	2024-07-21
2. Humans are invited to write cell backbones as complex numbers by writing polyribonucleotides as computable numbers	2024-07-01
3. 中美两国人工智能头部企业研发和创新的比较分析与启示	2024-06-28
4. 基于深度卷积神经网络的大学英语四级成绩早期预警	2024-06-28
5. 基于BERT模型的科技成果中图分类自动标引方法研究	2024-06-21
6. 甘肃方言数据库建设与研究	2024-06-12
7. 面向低资源语言机器翻译的平行语料句对齐评分	2024-06-05
8. Turing’s thinking machine and ’t Hooft’s principle of superposition of states	2024-05-14
9. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
10. Guiding Large Language Models to Generate Computer-Parsable Content	2024-04-23


公开评论匿名评论仅发给作者

基于End-to-end深度强化学习的多车场车辆路径优化 后印本

版本历史

相关论文推荐

基于End-to-end深度强化学习的多车场车辆路径优化后印本