相关题目
单选题
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
单选题
在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()。
单选题
()有跟环境进行交互,从反馈当中进行不断的学习的过程。
单选题
关于MNIST,下列说法错误的是()。
单选题
前馈型神经网络的中各个层之间是()的,反馈型神经网络中各个层之间是()的。
单选题
手写数字识别的例子中,输入的图片为长和宽都是28像素的图片,输出判断数字0-9的概率。要构建前馈型神经网络去解决这个问题,输入层是()维的,输出层是()维的。
单选题
()是用来评估神经网络的计算模型对样本的预测值和真实值之间的误差大小。
单选题
能够提取出图片边缘特征的网络是()。
单选题
无监督学习需要( )
单选题
A*搜索算法何时是最优的?( )
