多选题
Transformer应用有哪些方式是合理的?
A
预训练时单独使用编码器学习预测下一个token,在微调阶段卜理语言生成任务时,保留原来的分类器结构和参数
B
单独使用解码器(Decoder-Only结构),用于处理语言生成、问答等任务
C
预训练时单独使用编码器学习预测缺失token,可以直接用于处理下游分类任务
D
单独使用编码器,用于处理分类、序列标记等任务
答案解析
正确答案:ABD
相关知识点:
Transformer应用方式合理选
题目纠错
2025年数字赋能基层自主数据应用建设技能竞赛
相关题目
单选题
各业务部门引导分子公司强化场景建设考核工作,从创新度、价值度、难易度等方面,差异化设置各场景考核指标,将()、()等纳入评价指标,突出业务价值创造导向。
单选题
“大瓦特”包括由()、()、()所构成的人工智能模型体系,及该体系所支撑的数字电网、数字运营、数字服务、 数字产业系列场景。
单选题
关于GPT4说法正确的是哪些?
单选题
哪些方法对提高基础模型效果是有害的?
单选题
基础模型的微调机制大致有哪几类?
单选题
关于微调训练,下面描述正确的是:
单选题
ChatGPT产生过程中涉及的关键步骤不包含哪些?
单选题
ChatGPT产生过程中涉及的关键步骤有哪些?
单选题
关于GPT4,下面哪个判断可能是不正确的?
单选题
关于大模型,以下论述正确的是?
