单选题
856.强化学习中,智能体通过什么来优化其行为策略?
A
奖励信号
B
损失函数
C
梯度下降
D
决策树
答案解析
正确答案:A
相关知识点:
强化学习智能体,奖励优化行为策
题目纠错
人工智能训练师题库
相关题目
单选题
3995.数据库安全审计的操作日志默认会一直保存
单选题
3994.readlines())函数可以一次读取整个文件,自动将文件内容分析成一个行的列表
单选题
3993.带有else子句的异常处理结构,如果不发生异常则执行else子句中的代码
单选题
3992.谓词公式是指无论是命题逻辑还是谓词逻辑,可以利用连接词把些简单的命题连接起来构成一个合命题,表示一个比较复杂的含义A、正确
单选题
3991.图灵认为,人工智能应当是一个模拟成人成熟思维的系统
单选题
3990.理论上来说,通过人工智能技术,可以合成和奥巴马一样的声音
单选题
3989.预先给计算机要学习的数据进行了分类,属于监督学习方法
单选题
3988.针对电力指纹识别,通常有两大类算法,分别是机器学习算法和启发式算法
单选题
3987.模糊性就是指客观事物在性态及类属方面的不分明性,其根源是在类似事物间存在一系列过渡状态,它们相互渗透,相互贯通,使得彼此之间没有明显的分界线
单选题
3986.Shuffle处理:为了确保每个reduce()函数的输入都按键排序
