强化学习中agent与actor的区别

来源:费意栏目:生活时间:2024-05-22 06:22:23

Agent无处理逻辑,只收lambda,用lambda加工自己的状态。Actor有逻辑,收消息,消息可以是数据也可以lambda,Actor处理消息。关键区别是:Actor有个主动过滤消息的过程;而agent没有,是被动的,不论什么lambda都要执行。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的常见模型是标准的马尔可夫决策过程。

免责声明:该内容由用户自行上传分享到《 秘密研究社》,仅供个人学习交流分享。本站无法对用户上传的所有内容(包括且不仅限于图文音视频)进行充分的监测,且有部分图文资源转载于网络,主要用于方便广大网友在线查询参考学习,不提供任何商业化服务。若侵犯了您的合法权益,请立即通知我们( 管理员邮箱:[email protected]),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!!