A、文本频率指数;$;$逆文本频率指数$;$词频指数$;$逆词频指数
答案:B
A、文本频率指数;$;$逆文本频率指数$;$词频指数$;$逆词频指数
答案:B
A. 基于规则的分词简单高效,但是词典维护困难。$;$在实际工程应用中,分词一般只采用一种分词方法。$;$统计分词的目的就是对分词结果进行概率计算,获得概率最大的分词方式。$;$中文不同于英文自然分词,中文分词是文本处理的一个基础步骤。分词性能的好坏直接影响比如词性、句法树等其他模块的性能。
A. 自然语言理解$;$自然语言处理$;$自然语言输入$;$自然语言生成
A. 特征选择$;$树的生成$;$分类决策规则$;$树的剪枝
A. 无监督学习$;$半监督学习$;$强化学习$;$有监督学习
A. 相关分析$;$方差分析$;$回归分析$;$数据分析
A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象$;$K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念$;$K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇$;$K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇