用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库题目详情

CB6C09EC34E00001C0C418901FB11A1A

人工智能训练师题库

4,855

单选题

1388.在强化学习中,策略梯度(PolicyGradient)方法主要用于解决什么问题?

A

模式识别。

B

寻找最优策略。

C

解决组合优化问题。

D

估计状态值函数。

答案解析

正确答案：B

相关知识点：

策略梯度用于找最优策略

题目纠错

人工智能训练师题库

扫码进入小程序
随时随地练习

相关题目

3464.神经网络训练中,以下哪些技术可以帮助防止过拟合?

3463.在机器学习中,以下哪些评估指标常用于分类问题?

3462.神经网络训练中,反向传播算法和梯度下降算法通常如何结合使用?

3461.在监督学习中,哪些任务属于分类问题?

3460.序列标注包括()。

3459.嵌入式SQL语句中游标的使用步骤有()。

3458.智能控制的开发,目前认为有以下途径

3457.虚拟专用网络(VPN)的应用场景有哪些?

3456.通用网络爬虫基本工作流程包含()。

3455.下列哪些属于强化学习的应用领域?

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码