单选题
1233.在强化学习中,价值函数(ValueFunction)的主要用途是什么?
A
评估特定状态下采取某一行动的期望回报。
B
确定智能体在任何状态下的最佳行动。
C
描述环境的动态特性。
D
提供即时奖励信息。
答案解析
正确答案:A
题目纠错
人工智能训练师题库
相关题目
单选题
3618.统计学研究首先要确立样本空间,进行合理抽样,然后估测出相关的情况。
单选题
3617.人工神经元网络会遭遇“框架问题”。
单选题
3616.推理的本质是在信息不足的情况下能够最大程度的得到最靠谱的结论。
单选题
3615.计算机具有触类旁通的能力,可以根据具体语境对事件进行分类。
单选题
3614.符号AI不是人工智能的正统。
单选题
3613.符号AI是将人的思维通过逻辑语言制成流形图让计算机去执行。
单选题
3612.SSML是语音合成标记语言,它是W3C的语音接口框架的一部分
单选题
3611.数据标记时只能对原始数据添加一个标签
单选题
3610.TTS语速太快我需要将其调整慢,我可以通过调整speech(rate的值来调整语速的快慢
单选题
3609.ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样
