AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 人工智能训练师题库 题目详情
CB6C09EC34E00001C0C418901FB11A1A
人工智能训练师题库
4,855
单选题

1239.在强化学习中,Q-learning和SARSA的主要区别是什么?

A
"Q-learning"使用目标值,而"SARSA"使用奖励值。
B
"Q-learning"是离线的,而"SARSA"是在线的。
C
"Q-learning"使用ε-greedy策略,而"SARSA"使用softmax策略。
D
"Q-learning"更新下一状态的价值,而"SARSA"更新当前状态的价值。

答案解析

正确答案:B
题目纠错
人工智能训练师题库

扫码进入小程序
随时随地练习

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码