单选题
1242.在强化学习中,策略(Policy)的定义是什么?
A
一个奖励函数。
B
一个状态转移函数。
C
从状态到动作的映射。
D
一个价值函数。
答案解析
正确答案:C
相关知识点:
强化学习策略是状态到动作
题目纠错
人工智能训练师题库
相关题目
单选题
3609.ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样
单选题
3608.删除错误是指实际语音中有,识别结果里没有
单选题
3607.用户画像是属于多标签分类
单选题
3606.文本语言生成在神经网络模型上存在一字随机性,但风险是可控的
单选题
3605.声音转文字如果没有达到100%,说明这个模型不行
单选题
3604.分类任务有:二分类,多分类,多标签分类
单选题
3603.召回率(RecallRate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;
单选题
【】
单选题
3602.深度学习中以下()步骤是由模型自动完成的。
单选题
3601.智能的特点是()。
