单选题
1426.在强化学习中,Q-Learning算法使用的表格Q-table是用来存储什么的?
A
每个状态的动作值估计
B
每个状态的概率分布
C
模型的参数权重
D
每个状态的动作集合
答案解析
正确答案:A
相关知识点:
Q-Learning用Q表存动作值
题目纠错
人工智能训练师题库
相关题目
单选题
3426.WEB应用中,弹性负载均衡支持哪些协议?
单选题
3425.以下不正确的是()。
单选题
3424.在自然语言处理任务中,哪些技术适用于提升机器翻译、自动问答系统的性能:
单选题
3423.下列说法中,不正确的是()。
单选题
3422.下面的选项是关系数据库基本特征的是()。
单选题
3421.下列属于中国计算机互联网的有()
单选题
3420.定义类如下:classhello():defshowInfo(sef):print(self.x)下面描述正确的是
单选题
3419.下列有关于存储器的叙述中()是错误的
单选题
3418.在深度学习模型训练中,哪些技术可以用于防止梯度爆炸和提高稳定性:
单选题
3417.下列哪些是监督学习的算法?
