单选题
1014.在强化学习中,什么是“动态规划”(DynamicProgramming)?
A
一种用于优化策略的方法
B
一种用于计算状态值的方法
C
一种用于选择动作的规则
D
一种用于表示环境模型的数据结构
答案解析
正确答案:B
相关知识点:
推荐系统目标是推荐内容
题目纠错
人工智能训练师题库
相关题目
单选题
3837.OneHotEncoder是一种不能够被scikit-learn的估计器使用的类别特征转换函数
单选题
3836.数据科学是根据数据世界的分析结果,对现实世界进行预测、洞见、解释或决策的新兴科学
单选题
3835.静态方法不需要关键字self
单选题
3834.数据库审计服务发生异常,5分钟内用户可以收到告警信息
单选题
3833.命题是能判断真假的陈述句
单选题
3832.在梯度分别为正负的两个点之间,一定存在一个梯度为0的点
单选题
3831.目前股市仍处于政府控制行为阶段
单选题
3830.机器人相比较股民优势体现为可以通过指标分析来操作股市
单选题
3829.大数据的存储方案通常对一份数据在不同节点上存储多份副本,以提高系统容错性
单选题
3828.机器学习为数据科学中充分发挥计算机的自动数据处理能力,拓展人的数据处理能力以及实现人机协同数据处理提供了重要手段。()
