单选题
310、【单选题 #7】在基于模型的强化学习中,智能体使用环境的( )来帮助解释奖励信号,并决定如何行动。
A
动态规划
B
转移模型
C
奖励模型
D
策略模型
答案解析
正确答案:B
题目纠错
人工智能基础与应用A-题库--选择题(课本后题目)
相关题目
单选题
275、【单选题 #5】强化学习使用机器的个人历史和经验来做出决定,其经典应用是( )。
单选题
274、【单选题 #5】无监督学习又称归纳性学习,分为( )。
单选题
273、【单选题 #5】监督学习的主要类型是( )。
单选题
272、【单选题 #5】( )学习是指输入数据中有导师信号,以概率函数、代数函数或人工神经网络为基函数模型,采用迭代计算方法,学习结果为函数。
单选题
271、【单选题 #5】有3种主要类型的机器学习:监督学习、无监督学习和( )学习,各自有着不同的特点。
单选题
270、【单选题 #5】机器学习的核心是“使用( )解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。
单选题
269、【单选题 #5】( )是一种具有非线性适应性信息处理能力的算法,可克服传统人工智能方法对于直觉方面的缺陷,得到迅速发展。
单选题
268、【单选题 #5】( )作为机器学习重要算法之一,是一种利用多个树分类器进行分类和预测的方法。
单选题
267、【单选题 #5】( )环境下的机器学习主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。
单选题
266、【单选题 #5】( )机器学习主要研究学习机制,注重探索模拟人的学习机制,研究内容包括决策树、随机森林、人工神经网络、贝叶斯学习等方面。
