单选题
1422.在强化学习中,“ε-greedy”策略是指智能体在选择行动时:
A
总是选取当前状态下价值最高的行动
B
按照预设概率随机探索所有可能行动
C
大部分情况下采取最优行动,但有一定概率随机探索
D
仅当所有已知行动的价值都一样时才进行随机选择
答案解析
正确答案:C
相关知识点:
ε-greedy多数选优偶尔探
题目纠错
人工智能训练师题库
相关题目
单选题
3430.CIFAR-10数据集的描述正确的是()。
单选题
3429.在自然语言处理任务中,哪些技术适用于提升自动文本摘要生成和情感分析的自然性和流畅性:
单选题
3428.下列为填空题题型的是
单选题
3427.交换机堆叠后,主交换机的选举方式有?
单选题
3426.WEB应用中,弹性负载均衡支持哪些协议?
单选题
3425.以下不正确的是()。
单选题
3424.在自然语言处理任务中,哪些技术适用于提升机器翻译、自动问答系统的性能:
单选题
3423.下列说法中,不正确的是()。
单选题
3422.下面的选项是关系数据库基本特征的是()。
单选题
3421.下列属于中国计算机互联网的有()
