用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库题目详情

CB6C09EC34E00001C0C418901FB11A1A

人工智能训练师题库

4,855

单选题

1276.强化学习中,Q-learning算法主要用于什么?

A

状态估计

B

动作选择

C

奖励最大化

D

策略优化

答案解析

正确答案：D

相关知识点：

Q-learning用于策略优化

题目纠错

人工智能训练师题库

扫码进入小程序
随时随地练习

相关题目

3576.合作伙伴对物理专线,可以有哪些操作?

3575.在深度学习中,哪些技术可以用于提高模型在图像分类和文本处理任务上的泛化能力:

3574.依据自然语言是处理系统的输入还是输出,自然语言处理完成的功能可以划分为一下两类。

3573.数据归约的策略有()。

3572.图像区域标注现在可以使用的手段有()。

3571.合并分E-R图时,分E-R图之间的冲突主要有().

3570.DELETE(DEL)键的功能是()

3569.数据库工作单元与主语言程序工作单元之间的通信主要包括().

3568.不能让计算机能够说话

3567.日志文件的具体作用表现为()

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码