新闻中心

公司新闻

行业动态

联系我们

http://www.yexiaochao.com/

http://www.shengjiangjichuzu.com/

http://www.guangzhouyuntichechuzu.com/

http://www.panyuyuntichechuzu.com/

http://www.shundeyuntichechuzu.com/

http://www.huaduyuntichechuzu.com/

http://www.nanshayuntichechuzu.com/

http://www.jiangmenyuntichechuzu.com/

http://www.zhaoqingyuntichechuzu.com/

http://www.foshanyuntichechuzu.com/

http://www.zhuhaiyuntichechuzu.com/

http://www.yuntichechuzu.com/

http://www.yuntichuzu.com/

新闻详细

江门云梯车, 江门云梯车出租, 江门云梯车租赁将ＤＱＮ算法应用于机械臂运动控制领域中

新闻分类：公司新闻   作者：admin    发布于：2018-07-084    文字：【大】【中】【小】

摘要：

江门云梯车, 江门云梯车出租, 江门云梯车租赁将ＤＱＮ算法应用于机械臂运动控制领域中，提出了两种基于ＤＱＮ的改进算法，一种为引导式ＤＱＮ算法，一种为递归式ＤＱＮ算法。两种算法都参考了原始ＤＱＮ算法的部分网络结构，并针对机械臂抓取物体这个场景分别设计了感知环境模型和动作设计，完成了以下工作：

（１）将机械臂抓取物体的过程描述为一个马尔科夫决策过程，建立了机械臂感知环境模型，设计了机械臂动作空间以及回报函数，提出了数据增强机制。采用ＤＱＮ的网络架构使机械臂可以在复杂的环境中直接通过原始图像数据成功学习到控制策略。

（２）针对原始ＤＱＮ算法中探索策略的局限性问题，提出了一种引导式ＤＱＮ算法，利用多个分流网络来随机化值函数，临时扩展对状态空间的探索范围，实现深层探索。通过这种分布式的深度探索方法，充分保证了智能体对不同策略的探索，产生多样化的样本，使环境的动态信息更好地泛化到位置的状态空间中。

（３）针对真实场景中很少存在对环境状态完全可观测的情况，本课题提出了一种递归式ＤＱＮ算法，应用于部分可观测马尔科夫决策过程。对于原始ＤＱＮ网络模型进行改进，即像原有网络中添加循环祌经网络结构，使模型具有时间轴上的记忆能力。同时为了减小三维真实环境映射到二维图像上的映射误差，采用了多角度的思想来对机械臂环境的隐含信息进行建模。

（４）通过机械臂平台进行实验，使用原始ＤＱＮ模型以及两种改进模型在机械臂上进行训练和测试。通过与原始ＤＱＮ模型的实验结果对比，证明了这两种改进算法的有效性。并且。此外，为保证训练过程的连贯性，同时避免机械臂与自身或外界物体发生碰撞引发的安全问题，本文提出了机械臂安全保障机制。

江门云梯车, 江门云梯车出租, 江门云梯车租赁

本文成功的证明了引导式ＤＱＮ和递归式ＤＱＮ算法在机械臂策略控制上的有效性，但还有许多问题需要我们进行深入研究和解决。下一步的研究工作如下：

（１）本文提出的两种改进算法中均使用经验重放机制，这需要大量的存储空＿间来存储训练样本，对于存储空间的需求显著增加，其后的研究中应改进经验重＇放机制使得算法不再需要存储大量样本，节省存储资源的开销。

（２）本文提出的引导式ＤＱＮ算法在网络模型中分流了多个值函数的支路，增加了网络的计算负担。因此可以采用模型并行化的方法，比如提升网络规模，增加卷积层数量），或者可以使用多个ＧＰＵ训练，又或者可以对算法个部分并行化提尚计算效率。

（３）本文的实验采用的是较为简单的奖赏矩阵处理环境中的奖励信号问题，但目前大部分的智能体结构及环境都较为复杂，需要人工设计合理的回报函数来获得奖励信号，不合理的回报函数可能会导致学习延迟收敛，更有可能导致策略发生偏离，构造一个符合实际应用的回报函数也是今后研究的一个方向。

江门云梯车, 江门云梯车出租, 江门云梯车租赁

附件下载： (已下载0次)

标签：

分享到：
点击次数：1046  更新时间：2018-07-08  【打印此页】  【关闭】

上一条：东莞云梯车, 东莞云梯车出租, 东莞云梯车租赁，深层探索的显著优势在于提高了智能体在面对复杂的大规模深度强化学习任务时速度，收敛速度快    下一条：清远云梯车, 清远云梯车出租, 清远云梯车租赁基于区间约束三维违反矢量的机械结构性能稳健优化设计

网站首页

关于我们

产品展示

新闻中心

在线留言

联系我们

公司新闻

行业动态