用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心唐人街探案之秦风题目详情

C9FF7D803E90000159811C7D1C201D0B

唐人街探案之秦风

3,655

单选题

蒙特卡罗强化学习算法的本质，是通过多次尝试后求平均来作为期望累计奖赏的金丝，但它在求平均时是采用哪种方式进行？

A

逐一式

B

循环式

C

分组式

D

批处理

答案解析

正确答案：D

解析：

蒙特卡罗强化学习是在一个完整的采样轨迹完成后再对所有的状态-动作对进行更新，属于“批处理式”

唐人街探案之秦风

扫码进入小程序
随时随地练习

相关题目

关于有向图模型，说法正确的时（）

关于随机森林平均精确率减少，以下说法不正确的是（）

关于归一化描述正确的是（）。

在深度学习任务中，遇到数据不平衡问题时，我们可以用以下哪些方法进行解诀?

常见的脏数据的类型有哪些?

SVM 中常用的核函数包括哪些?

正则化是传统机器学习中重要且有效的减少泛化误差的技术，以下技术属于正则化技术的是

以下选项中对随机变量数值特征描述正确的是？

优化理论中，把一个问题转化为凸优化问题，是重要一步。下列运算能够维持函数凸性的是？

人工智能算法中，常见的梯度下降法包括哪些种类？

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码