用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库_1500题题目详情

CB4936BF39B000014EF9DEDA13CE2300

人工智能训练师题库_1500题

1,500

单选题

在强化学习中，策略梯度方法主要用于优化（）。

A

价值函数

B

环境模型

C

策略函数

D

奖励函数

答案解析

正确答案：C

解析：

暂无解析

相关知识点：

强化学习策略，梯度优化策略函

题目纠错

人工智能训练师题库_1500题

扫码进入小程序
随时随地练习

相关题目

（）是正确的Python字符串。

（）用卷积神经网络处理效果比较好。

关于深度学习的实质及其与浅层学习的区别，说法正确的有（）。

机器智能的内涵包括（）。

常见的图像数据标注类型包括（）。

（）数据是字符型数据。

属于闭区域标注的有（）。

（）可以认为是计算机视觉的任务。

用到语音识别技术的应用包括（）。

（）是数值数据类型(即可用于算术表达式)。

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码