分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-10-11 合作期刊: 《计算机应用研究》
摘要: 深度Q网络存在严重的过估计问题,导致智能体寻找最优策略的能力下降。为了缓解深度Q网络中存在的过估计问题,提出一个更正函数用于对深度Q网络中的评价函数进行改进,当选择的动作为最优动作时更正函数为1,不对当前状态—动作值进行修改,当选择的动作不是最优动作时更正函数小于1,缩小当前状态—动作值,从而使得最优状态—动作值与非最优状态—动作值的差异增大,减少过估计问题的影响。实验证明改进的算法在Playing Atari 2600视频游戏以及OpenAI Gym中取得了更好的性能。说明改进的算法比深度Q网络寻得了更优的策略。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 针对传统免疫网络动态优化算法局部寻优能力弱、寻优精度低及易早熟收敛的缺点,提出一种求解动态优化问题的免疫文化基因算法。基于文化基因算法基本框架,将人工免疫网络算法作为全局搜索算法,采用禁忌搜索算法作为局部搜索算子;同时引入柯西变异加强算法的全局搜索能力,并有效防止早熟收敛。通过对经典动态优化函数测试集在相同条件下的实验表明,该免疫文化基因算法相较于其他同类算法具有较好的搜索精度和收敛速度。