AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 人工智能训练师题库 题目详情
CB6C09EC34E00001C0C418901FB11A1A
人工智能训练师题库
4,855
单选题

1458.在强化学习中,价值函数(ValueFunction)和回报函数(RewardFunction)有何不同?

A
价值函数评估了一个状态或行为序列的总回报,而回报函数定义了每个状态或行为的即时回报。
B
回报函数评估了一个状态或行为序列的总回报,而价值函数定义了每个状态或行为的即时回报。
C
两者都是用来评估策略的好坏,没有区别。
D
价值函数是静态的,而回报函数是动态变化的。

答案解析

正确答案:A

相关知识点:

强化学习价值回报函数不同

题目纠错
人工智能训练师题库

扫码进入小程序
随时随地练习

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码