278、【单选题 #5】在机器学习的具体应用中,( )决定了学习系统基本结构的工作内容,确定了学习部分所需要解决的问题。① 环境② 知识库③ 执行部分④ 控制器
答案解析
解析:
相关题目
307、【单选题 #7】( )是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。
306、【单选题 #7】在强化学习中,每一个自主体由两个神经网络模块组成,即( )。
305、【单选题 #7】强化学习主要由智能体和环境组成,两者间通过( )3个信号进行交互。① 奖励② 状态③ 反馈④ 动作
304、【单选题 #7】强化学习的常见模型是标准的( )。
303、【单选题 #7】在强化学习中,( )选择一个动作作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给智能体。
302、【单选题 #7】强化学习是从( ),参数扰动自适应控制等理论发展而来的,其基本原理是:如果智能体的某个行为策略导致环境正的奖赏,那么该智能体以后产生这个行为策略的趋势便会加强。
301、【单选题 #7】强化学习不要求预先给定任何数据,主要表现在强化信号上,通过接收环境对动作的( )获得学习信息,并更新模型参数。
300、【单选题 #7】强化学习侧重在线学习,并试图在探索—利用间保持平衡,用于描述和解决智能体在与环境的交互过程中,以“( )”的方式,通过学习策略达成回报最大化或实现特定目标的问题。
299、【单选题 #7】强化学习是机器学习中一种广泛应用于创建( )的模式,其主要问题是:一个智能体如何在环境未知,只提供对环境的感知和偶尔的奖励情况下,对某项任务变得精通。
298、【单选题 #6】下列场景中,( )是深度学习技术的典型应用领域。① 语音识别② 科学计算③ 机器翻译④ 自动驾驶
