用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库题目详情

CB6C09EC34E00001C0C418901FB11A1A

人工智能训练师题库

4,855

单选题

1242.在强化学习中,策略(Policy)的定义是什么?

A

一个奖励函数。

B

一个状态转移函数。

C

从状态到动作的映射。

D

一个价值函数。

答案解析

正确答案：C

相关知识点：

强化学习策略是状态到动作

题目纠错

人工智能训练师题库

扫码进入小程序
随时随地练习

相关题目

3609.ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样

3608.删除错误是指实际语音中有,识别结果里没有

3607.用户画像是属于多标签分类

3606.文本语言生成在神经网络模型上存在一字随机性,但风险是可控的

3605.声音转文字如果没有达到100%,说明这个模型不行

3604.分类任务有:二分类,多分类,多标签分类

3603.召回率(RecallRate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;

【】

3602.深度学习中以下()步骤是由模型自动完成的。

3601.智能的特点是()。

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码