263、【单选题 #5】20世纪70年代中叶到80年代中叶称为( )时期。在此期间,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和学习方法,开始把学习系统与各种应用结合起来。
答案解析
相关题目
322、【单选题 #8】数据不等于信息,而信息也不等于知识。了解数据(将其转化为信息)并利用数据(再将其转换为知识)是一项( )的工程。
321、【单选题 #8】现实社会有大量的数据唾手可得,其中的大部分数据都十分有用,但前提是人们有能力从中提取出( )的内容。
320、【单选题 #8】数据挖掘通常与计算机科学有关,并通过统计学、在线分析处理、( )、专家系统(依靠过去的经验法则)和可视化技术等诸多方法来实现其目标。① 情报检索 ② 模式识别③ 科学计算 ④ 机器学习
319、【单选题 #8】数据挖掘是指从大量的数据中通过算法搜索其中隐含的、先前未知的并有( )的信息的非平凡的决策支持过程。
318、【单选题 #7】就目前的情况而言,对于需要( )的关键任务而言,强化学习可能并不是最理想的选择。
317、【单选题 #7】强化学习可以通过( )的方式生成大量高质量的可用于训练模型的数据。
316、【单选题 #7】在现实生活中,可以找到很多符合强化学习模型的例子,如( )等,这些都是积极奖励的例子。① 家中有矿② 父母的表扬③ 学校的好成绩④ 工作的高薪资
315、【单选题 #7】通过优化真实奖励函数的某个较为精确的近似函数,学习者可能会比专家表现得更好。该方法称为( ):通过观察策略来学习奖励,而不是通过观察奖励来学习策略。
314、【单选题 #7】某些领域过于复杂,以至于很难在其中定义强化学习所需的奖励函数。( )研究这样的问题:在提供了一些对专家行为观测的基础上,如何让学习表现得较好。
313、【单选题 #7】考虑这样的情形:有少量动作和状态,且环境完全可观测,其中智能体已经有了能决定其动作的固定策略。智能体将尝试学习( )——从状态出发,采用策略得到的期望总折扣奖励,称为被动强化学习。
