相关题目
单选题
常见的循环神经网络结构包括()
单选题
与浅层神经网络相比,深度学习的不同在于()和()。
单选题
()类型的数据集不适合用深度学习?
单选题
深度学习的训练过程包括:自下而上的()和自顶向下的()。
单选题
对于Word2vec的2个基础算法,每次()更新只能优化一个向量且softmax里的指数求和操作计算量太大,一般使用比较高效的()算法。
单选题
Embedding编码有哪些特点?
单选题
One-hot独热编码有哪些特点?
单选题
神经元分为三种不同类型的层次:
单选题
BERT模型的主要创新点都在pre-train方法上,即用了()和()两种方法分别捕捉词语和句子级别的representation。
单选题
Transformer的提出解决了上面两个问题,首先它使用了Attention机制,将序列中的任意两个位置之间的距离缩小为一个();其次它不无需依次输入序列信息,因此具有更好的(),符合现有的GPU框架。
