相关题目
单选题
Dropout对一个神经元随机屏蔽输入权重
单选题
对于非连续目标在深度神经网络的优化过程中,AdaGrad梯度下降方法是最好的
单选题
有许多种梯度下降算法,其中两种最出名的方法是l-BFGS和SGD。l-BFGS根据二阶梯度下降而SGD是根据一阶梯度下降的。
只有在数据很稀疏的场景中,会更加偏向于使用l-BFGS而不是SGD
单选题
将Sigmoid激活函数改为ReLu,将有助于克服梯度消失问题
单选题
在神经网络中,每个参数可以有不同的学习率
单选题
可以通过将所有权重初始化为0来训练网络
单选题
卷积的物理意义是:一个函数(如:单位响应)在另一个函数(如:输入信号)上的加权叠加。
单选题
训练CNN时,可以对输入进行旋转、平移、缩放等预处理提高模型泛化能力
单选题
给定一个长度为n的不完整单词序列,我们希望预测下一个字母是什么。比如输入是“predictio”(9个字母组成),希望预测第十个字母是什么。下面哪种神经网络结构适用于解决这个工作?
单选题
深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m∗n,n∗p,p∗q,且m<n<p<q,以下计算顺序效率最高的是
