单选题
1463.在强化学习中,策略梯度方法主要用于解决什么类型的问题?
A
离散动作空间的问题。
B
连续动作空间的问题。
C
只有两个动作可选的问题。
D
无需动作选择的问题。
答案解析
正确答案:B
相关知识点:
策略梯度:解决连续动作问题
题目纠错
人工智能训练师题库
相关题目
单选题
3389.以下哪些是人工智能在医疗领域的应用?
单选题
3388.信息化的文化内涵主要表现在()
单选题
3387.以下那些方面是机器人能够做到的
单选题
3386.数据模型通常由()要素组成
单选题
3385.在深度学习模型设计中,哪些技术有助于提高模型的训练效率和稳定性:
单选题
3384.在深度学习中,哪些方法可以用于加速模型训练并提高模型在图像和文本处理任务上的准确性:
单选题
3383.微型计算机的系统总线由()组成
单选题
3382.机器翻译的局限性在于()。
单选题
3381.在三层模式结构中,()是数据库的核心和关键,()通常是模式的子集,数据按模式的描述提供给用户,按()的描述存储在硬盘上.
单选题
3380.非融合ELB支持
