AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 人工智能基础与应用A-题库--选择题(课本后题目) 题目详情
CB3CF521B7D00001A5E21A1BB26096D0
人工智能基础与应用A-题库--选择题(课本后题目)
333
单选题

271、【单选题 #5】有3种主要类型的机器学习:监督学习、无监督学习和( )学习,各自有着不同的特点。

A
重复
B
强化
C
自主
D
优化

答案解析

正确答案:B
题目纠错
人工智能基础与应用A-题库--选择题(课本后题目)

扫码进入小程序
随时随地练习

相关题目

单选题

314、【单选题 #7】某些领域过于复杂,以至于很难在其中定义强化学习所需的奖励函数。( )研究这样的问题:在提供了一些对专家行为观测的基础上,如何让学习表现得较好。

单选题

313、【单选题 #7】考虑这样的情形:有少量动作和状态,且环境完全可观测,其中智能体已经有了能决定其动作的固定策略。智能体将尝试学习( )——从状态出发,采用策略得到的期望总折扣奖励,称为被动强化学习。

单选题

312、【单选题 #7】从系统设计者的角度来看,智能体提供( )通常比提供有标签的行动样本要容易得多。在这种学习中,智能体与世界就其反映表现进行互动。

单选题

311、【单选题 #7】在无模型强化学习中,智能体直接学习如何采取行为方式,可以使用( )法求解。

单选题

310、【单选题 #7】在基于模型的强化学习中,智能体使用环境的( )来帮助解释奖励信号,并决定如何行动。

单选题

309、【单选题 #7】一般而言,( )是通过对数据进行分析,找到数据的表达模型,随后利用该模型,在新输入的数据上进行决策。

单选题

308、【单选题 #7】强化学习和监督学习的共同点是两者都需要大量的( )进行学习训练,但两者的学习方式不尽相同,两者所需的数据类型也有差异。

单选题

307、【单选题 #7】( )是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。

单选题

306、【单选题 #7】在强化学习中,每一个自主体由两个神经网络模块组成,即( )。

单选题

305、【单选题 #7】强化学习主要由智能体和环境组成,两者间通过( )3个信号进行交互。① 奖励② 状态③ 反馈④ 动作

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码