单选题
1008.在强化学习中,什么是“奖励”?
A
智能体选择动作的依据
B
智能体对环境的感知
C
环境对智能体动作的评价
D
智能体学习的目标
答案解析
正确答案:D
相关知识点:
强化学习奖励是学习目标
题目纠错
人工智能训练师题库
相关题目
单选题
3843.for语句以遍历对象的方式构造循环,有时却需要构造一种类似无限循环的程序控制结构或某种不确定运行次数的循环,此时就需要使用while语句。()
单选题
3842.目前一个RDS实例允许绑定多个安全组
单选题
3841.存在一种人类认为的可计算系统与图灵计算不等价
单选题
3840.通过监测电网设备的电气数据,利用人工智能技术和大数据技术挖掘出能够表征设备某种特性的特征点,然后将多个维度的特征点聚合起来,这种技术叫做电力指纹技术
单选题
3839.目前在专家系统中,知识的不确定性一般由领域专家给出,通常是一个数值,它表示相应知识的不确定性程度,称为知识的动态强度
单选题
3838.均值滤波存在不希望的边缘模糊负面效应
单选题
3837.OneHotEncoder是一种不能够被scikit-learn的估计器使用的类别特征转换函数
单选题
3836.数据科学是根据数据世界的分析结果,对现实世界进行预测、洞见、解释或决策的新兴科学
单选题
3835.静态方法不需要关键字self
单选题
3834.数据库审计服务发生异常,5分钟内用户可以收到告警信息
