判断题
4563.强化学习中的目标是使智能体学会在给定环境中采取行动以获得最大化的累积奖励。()
A
正确
B
错误
答案解析
正确答案:A
相关知识点:
强化学习求最大化累积奖励
题目纠错
人工智能训练师题库
相关题目
单选题
288.查找条件为:姓名不是NULL的记录()
单选题
287.用于将事务处理写到数据库的命令是()
单选题
286.UNIQUE惟一索引的作用是()
单选题
285.要得到最后一句SELECT查询到的总行数,可以使用的函数是()
单选题
284.查找表结构用以下哪一项()
单选题
283.若要撤销数据库中已经存在的表S,可用()。
单选题
282.以下能够删除一列的是
单选题
281.使用CREATETABLE语句的()子句,在创建基本表时可以启用全文本搜索
单选题
280.SQL语句中的条件用以下哪一项来表达()
单选题
279.SELECT语句的完整语法较复杂,但至少包括的部分是()
