用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库题目详情

CB6C09EC34E00001C0C418901FB11A1A

人工智能训练师题库

4,855

单选题

1012.在强化学习中,什么是“马尔可夫决策过程”(MDP)?

A

一种用于描述环境动态性的模型

B

一种用于选择动作的算法

C

一种用于计算奖励的方法

D

一种用于表示状态的数据结构

答案解析

正确答案：A

相关知识点：

MDP描述环境动态性模型

题目纠错

人工智能训练师题库

扫码进入小程序
随时随地练习

相关题目

3839.目前在专家系统中,知识的不确定性一般由领域专家给出,通常是一个数值,它表示相应知识的不确定性程度,称为知识的动态强度

3838.均值滤波存在不希望的边缘模糊负面效应

3837.OneHotEncoder是一种不能够被scikit-learn的估计器使用的类别特征转换函数

3836.数据科学是根据数据世界的分析结果,对现实世界进行预测、洞见、解释或决策的新兴科学

3835.静态方法不需要关键字self

3834.数据库审计服务发生异常,5分钟内用户可以收到告警信息

3833.命题是能判断真假的陈述句

3832.在梯度分别为正负的两个点之间,一定存在一个梯度为0的点

3831.目前股市仍处于政府控制行为阶段

3830.机器人相比较股民优势体现为可以通过指标分析来操作股市

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码