单选题
1425.在自然语言处理中,BERT(BidirectionalEncoderRepresentationsfromTransformers)模型利用了什么技术?
A
自注意力机制
B
条件随机场
C
隐马尔科夫模型
D
最大熵模型
答案解析
正确答案:A
相关知识点:
BERT模型用自注意力
题目纠错
人工智能训练师题库
相关题目
单选题
3427.交换机堆叠后,主交换机的选举方式有?
单选题
3426.WEB应用中,弹性负载均衡支持哪些协议?
单选题
3425.以下不正确的是()。
单选题
3424.在自然语言处理任务中,哪些技术适用于提升机器翻译、自动问答系统的性能:
单选题
3423.下列说法中,不正确的是()。
单选题
3422.下面的选项是关系数据库基本特征的是()。
单选题
3421.下列属于中国计算机互联网的有()
单选题
3420.定义类如下:classhello():defshowInfo(sef):print(self.x)下面描述正确的是
单选题
3419.下列有关于存储器的叙述中()是错误的
单选题
3418.在深度学习模型训练中,哪些技术可以用于防止梯度爆炸和提高稳定性:
