单选题
在Q-learning中,Q表用来存储()。
A
状态值
B
动作值
C
状态-动作对的值
D
奖励值
答案解析
正确答案:C
解析:
暂无解析
相关知识点:
Q表存状态-动作对值
题目纠错
人工智能训练师题库_1500题
相关题目
单选题
Windows 修改3389端口可修改注册表HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Terminal Server\Wds\rdpwd\Tds\tcp
单选题
运算能力的高低对人工智能的影响很小
单选题
通过命令“ swapon -s”可以查看交换分区设备
单选题
不存在连续却处处不可导的曲线
单选题
在SMB的共享安全级别中,所有的资源和用户都共享同一个密码。
单选题
pip命令也支持扩展名为.whl的文件直接安装Python扩展库。
单选题
图形搜索法得到的轨迹可以保证位置和速度连续,不能保证加速度连续。
单选题
聊天机器人在某种程度上具备人类的心智。
单选题
某文件的权限为:drw-r--r--,该文件为一个目录。
单选题
逻辑运算符的运算优先级低于算术运算符 的运算优先级。
