单选题
1239.在强化学习中,Q-learning和SARSA的主要区别是什么?
A
"Q-learning"使用目标值,而"SARSA"使用奖励值。
B
"Q-learning"是离线的,而"SARSA"是在线的。
C
"Q-learning"使用ε-greedy策略,而"SARSA"使用softmax策略。
D
"Q-learning"更新下一状态的价值,而"SARSA"更新当前状态的价值。
答案解析
正确答案:B
题目纠错
人工智能训练师题库
相关题目
单选题
3612.SSML是语音合成标记语言,它是W3C的语音接口框架的一部分
单选题
3611.数据标记时只能对原始数据添加一个标签
单选题
3610.TTS语速太快我需要将其调整慢,我可以通过调整speech(rate的值来调整语速的快慢
单选题
3609.ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样
单选题
3608.删除错误是指实际语音中有,识别结果里没有
单选题
3607.用户画像是属于多标签分类
单选题
3606.文本语言生成在神经网络模型上存在一字随机性,但风险是可控的
单选题
3605.声音转文字如果没有达到100%,说明这个模型不行
单选题
3604.分类任务有:二分类,多分类,多标签分类
单选题
3603.召回率(RecallRate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;
