首页   

本文提出了一种基于双自回归机制和自监督学习的机器人世界模型(RW-20250121052351

爱可可-爱生活  · AI  · 1 周前

正文

2025-01-21 05:23

本文提出了一种基于双自回归机制和自监督学习的机器人世界模型(RWM),该模型具有强大的长时预测能力和鲁棒性,并结合MBPO-PPO策略优化方法,实现了在真实机器人上的零样本迁移,其核心创新在于通过自回归训练有效解决了世界模型长期预测的误差累积问题,且不依赖领域知识,为复杂机器人系统的策略学习提供了更通用的解决方案。
[RO]《Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics》C Li, A Krause, M Hutter [ETH Zurich] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com