266、【单选题 #5】( )机器学习主要研究学习机制,注重探索模拟人的学习机制,研究内容包括决策树、随机森林、人工神经网络、贝叶斯学习等方面。
答案解析
相关题目
319、【单选题 #8】数据挖掘是指从大量的数据中通过算法搜索其中隐含的、先前未知的并有( )的信息的非平凡的决策支持过程。
318、【单选题 #7】就目前的情况而言,对于需要( )的关键任务而言,强化学习可能并不是最理想的选择。
317、【单选题 #7】强化学习可以通过( )的方式生成大量高质量的可用于训练模型的数据。
316、【单选题 #7】在现实生活中,可以找到很多符合强化学习模型的例子,如( )等,这些都是积极奖励的例子。① 家中有矿② 父母的表扬③ 学校的好成绩④ 工作的高薪资
315、【单选题 #7】通过优化真实奖励函数的某个较为精确的近似函数,学习者可能会比专家表现得更好。该方法称为( ):通过观察策略来学习奖励,而不是通过观察奖励来学习策略。
314、【单选题 #7】某些领域过于复杂,以至于很难在其中定义强化学习所需的奖励函数。( )研究这样的问题:在提供了一些对专家行为观测的基础上,如何让学习表现得较好。
313、【单选题 #7】考虑这样的情形:有少量动作和状态,且环境完全可观测,其中智能体已经有了能决定其动作的固定策略。智能体将尝试学习( )——从状态出发,采用策略得到的期望总折扣奖励,称为被动强化学习。
312、【单选题 #7】从系统设计者的角度来看,智能体提供( )通常比提供有标签的行动样本要容易得多。在这种学习中,智能体与世界就其反映表现进行互动。
311、【单选题 #7】在无模型强化学习中,智能体直接学习如何采取行为方式,可以使用( )法求解。
310、【单选题 #7】在基于模型的强化学习中,智能体使用环境的( )来帮助解释奖励信号,并决定如何行动。
