用户名

AI智能推荐题库-试题通

AI智能整理导入题库-试题通

×

首页题库中心人工智能训练师题库题目详情

CB6C09EC34E00001C0C418901FB11A1A

人工智能训练师题库

4,855

单选题

1422.在强化学习中,“ε-greedy”策略是指智能体在选择行动时:

A

总是选取当前状态下价值最高的行动

B

按照预设概率随机探索所有可能行动

C

大部分情况下采取最优行动,但有一定概率随机探索

D

仅当所有已知行动的价值都一样时才进行随机选择

答案解析

正确答案：C

相关知识点：

ε-greedy多数选优偶尔探

题目纠错

人工智能训练师题库

扫码进入小程序
随时随地练习

相关题目

3430.CIFAR-10数据集的描述正确的是()。

3429.在自然语言处理任务中,哪些技术适用于提升自动文本摘要生成和情感分析的自然性和流畅性:

3428.下列为填空题题型的是

3427.交换机堆叠后,主交换机的选举方式有?

3426.WEB应用中,弹性负载均衡支持哪些协议?

3425.以下不正确的是()。

3424.在自然语言处理任务中,哪些技术适用于提升机器翻译、自动问答系统的性能:

3423.下列说法中,不正确的是()。

3422.下面的选项是关系数据库基本特征的是()。

3421.下列属于中国计算机互联网的有()

关闭登录弹窗

专为自学备考人员打造

自助导入本地题库

多种刷题考试模式

本地离线答题搜题

扫码考试方便快捷

海量试题每日更新

波浪装饰图

欢迎登录试题通

可以使用以下方式扫码登陆

使用APP登录

使用微信登录

试题通小程序二维码

联系电话:

400-660-3606

试题通企业微信二维码