相关题目
3.简述 TF-IDF 表示的含义,以及 TF、IDF 分别表示的含义。
TF-IDF 主要用来评估一个词语在一份语料库中对于其中一份文件的重要程度。词语的重要性会随着它在该文件中出现的次数而增加,但是也会同时随着它在语料库中其他文件出现的次数而减少。
TF 表示“单词频率”,是一个查询关键字中某一个单词在目标文档中出现的次数
2.简述 break 语句和 continue 语句两者的区别。
第 10 页 共 29 页
break 语句跳出整个循环体,循环体中未执行的循环将不会执行。continue 语句是跳出本次循环,继续进行下一次的循环。
1.简述一个完整的对话机器人框架所包含的五个模块各自的作用。
语音识别技术:将语音转换成文本信息
自然语言理解:将识别出来的文本信息转换成机器可以理解的语义表示
对话管理:根据自然语言理解输出的语义表示执行对话状态的更新和追踪,并根
据一定策略选择相应的候选动作
自然语言生成:负责生成需要恢复给用户的自然语言文本
10.软件测试是有风险的行为,并非所有的软件缺陷都能够被修复。( )
9. 端到端语音合成系统结构相对于传统 TTS 更简单。( )
8. 使用语义角色标注实现句法的分析步骤是先获得句法的分析结果,之后根据该句法分析最终实现语义角色标注。( )
7. 连接词识别其含义为识别任意的连续语音,连续语音是最自然的说话方式,在实现过程中比较复杂,成本较高。( )
6. 对于语音数据标注行业而言,语音数据标注的质量标准就是标注的多样性。( )
5. 如果训练中所使用的语音标注数据集存在大量噪声,将会导致机器学习训练不充分,无法获得规律,这样在训练效果验证时会出现目标偏离,无法识别的情况。( )
4. 发音为“我我好热”,“我”出现了重复,则应标注为“我好热”。( )
