多选题
Transformer模型中具有下面哪些模块
A
用于处理视觉信息的ConvolutionNeuralNetwork(CNN)层
B
用于初始化字符矢量的Embeddings层
C
用于汇聚信息的MultiHeadAttention(MHA)层
D
用于存储记忆的FeedFowardNetwork(FFN)层
答案解析
正确答案:BCD
题目纠错
2025年数字赋能基层自主数据应用建设技能竞赛
