多选题
下列描述属于传统循环神经网络的性质有()。
A
上一时刻的网络状态信息将会作用于下一时刻的网络状态
B
并行处理序列中的所有信息
C
容易梯度爆炸/消失
D
易于搭建
答案解析
正确答案:AC
解析:
循环神经网络(recurrent neural network,RNN)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。循环神经网络在误差梯度在经过多个时间步的反向传播后容易导致极端的非线性行为,包括梯度消失(gradient vanishing)和梯度爆炸(gradient explosion)。实践中,梯度爆炸虽然对学习有明显的影响,但较少出现,使用梯度截断可以解决。梯度消失是更常见的问题且不易察觉,发生梯度消失时,循环神经网络在多个时间步后的输出几乎不与序列的初始值有关,因此无法模拟序列的长距离依赖(long-term dependency)。在数值试验中,SRN对时间步跨度超过20的长距离依赖进行成功学习的概率接近于0。恰当的权重初始化(weight initialization)或使用非监督学习策略,例如神经历史压缩器(NHC)可提升循环神经网络学习长距离依赖的能力,但对更一般的情形,循环神经网络发展了一系列优化策略,其中有很多涉及网络结构的改变和算法的改进。
题目纠错
相关题目
单选题
假设已从标准库functools导入reduce()函数,那么表达式reduce(lambda x,y:x+y,[1,2,3])的值为()。
单选题
在局部生效,出了这个变量的作用域这个变量就失效了的变量是()。
单选题
须以正确的顺序传入函数,调用时的数量必须和声明时的一样的参数是()。
单选题
下列代码中能够打印出138-9922-0202这个电话号码(注意格式需要完全一致)的是()。
单选题
下列代码中最适合接受系统输入是一个整数的是()。
单选题
下列代码会输出1,2,3三个数字的是()。
单选题
下列说法正确的是()。
单选题
下列关于函数的说法正确的是()。
单选题
下列函数中可以计算字典元素个数的是()。
单选题
下列关于Python函数调用的说法错误的是()。
