AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 2025年数字赋能基层自主数据应用建设技能竞赛 题目详情
CB65483FBBB00001F36118C0F2101D22
2025年数字赋能基层自主数据应用建设技能竞赛
331
多选题

理解语言的AI一般不需要下面哪种数据?

A
字符编码
B
字形
C
排版
D
字体

答案解析

正确答案:BCD

解析:

本题考查人工智能在自然语言处理(NLP)任务中对语言理解所需的数据类型,核心在于区分“语言理解”与“文本呈现”两类不同层次的处理需求。\n\n题干关键限定词是“理解语言”,即AI需完成语义分析、句法解析、意图识别、上下文推理等认知层面任务,而非视觉呈现或排版渲染。\n\n逐项分析:\n\nA:字符编码——必需。 \n字符编码(如UTF-8、Unicode)是将文本符号映射为计算机可处理的数字序列的基础机制。NLP模型输入必须是离散的token序列(如字节、子词或字符ID),而这些ID依赖于底层字符编码方案。没有字符编码,文本无法被数字化表示,模型无法读取原始输入。因此,字符编码是语言理解的前提性基础设施,属于必需数据。\n\nB:字形——不需要。 \n字形(glyph)指字符在视觉上的具体形状(如“a”的不同书写变体、手写体、艺术体),属于字体渲染层面的视觉表征。语言理解关注的是符号所承载的抽象语言单位(如音位、词素、词汇、句法结构),而非其像素级外观。OCR系统虽需识别字形以还原文本,但那是“文本识别”阶段;一旦文本已被正确转录为字符串,后续的语言理解过程完全不依赖字形信息。故字形与语言理解无本质关联。\n\nC:排版——不需要。 \n排版(typesetting)涉及行距、缩进、分栏、对齐、换行、页眉页脚等文档布局信息。这些属于文档结构和视觉组织范畴,服务于人类阅读体验或出版需求。标准NLP任务(如机器翻译、情感分析、问答)仅需线性文本序列及其内在语言结构(词序、依存关系等),排版信息既不参与语义建模,也不影响语法判断。即使输入含HTML或PDF排版标记,NLP系统通常先做清洗(去除标签、合并换行),提取纯文本内容。\n\nD:字体——不需要。 \n字体(font)是字形的集合及其渲染参数(如粗细、斜体、字号)。它纯粹是输出显示或印刷时的视觉样式选择,与语言符号的语义、语法、语用属性无关。模型无法也无需通过字体特征推断词义或句法功能。例如,“hello”用Times New Roman或Arial显示,对其语义理解毫无影响。\n\n综上,B(字形)、C(排版)、D(字体)均属于文本的视觉表现层(presentation layer),而语言理解属于符号语义层(semantic layer)。二者在计算语言学中严格分离:前者由图形系统或文档处理器处理,后者由NLP模型处理。因此,理解语言的AI一般不需要字形、排版和字体这三类数据。\n\n正确答案:B、C、D。

相关知识点:

理解语言AI非需数据项

题目纠错
2025年数字赋能基层自主数据应用建设技能竞赛

扫码进入小程序
随时随地练习

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码