A、基于规则的分词简单高效,但是词典维护困难。$;$在实际工程应用中,分词一般只采用一种分词方法。$;$统计分词的目的就是对分词结果进行概率计算,获得概率最大的分词方式。$;$中文不同于英文自然分词,中文分词是文本处理的一个基础步骤。分词性能的好坏直接影响比如词性、句法树等其他模块的性能。
答案:B
A、基于规则的分词简单高效,但是词典维护困难。$;$在实际工程应用中,分词一般只采用一种分词方法。$;$统计分词的目的就是对分词结果进行概率计算,获得概率最大的分词方式。$;$中文不同于英文自然分词,中文分词是文本处理的一个基础步骤。分词性能的好坏直接影响比如词性、句法树等其他模块的性能。
答案:B
A. 1/5$;$2/5$;$3/5 $;$4/5
A. 反向传播只能在前馈神经网络中运用$;$反向传播可以结合梯度下降算法更新网络权重$;$反向传播会经过激活函数$;$反向传播指的是误差通过网络反向传播
A. K-means$;$BIRCH$;$SVM$;$DBSCAN
A. 决策树模型$;$kNN分类$;$Adaboost$;$k-means
A. 监督学习$;$倍监督学习$;$半监督学习$;$无监督学习
A. Web搜索引擎$;$超市条形码扫描器$;$声控电话菜单$;$智能个人助理
A. 数据$;$设备$;$计算机$;$技术
A. 熵越大,不确定性越大,信息量也就越大$;$信息增益越大,表示某个条件熵对信息熵减少程序越大,也就是说,这个属性对于信息的判断起到的作用越大$;$Gini指数越大,不纯度越小,越容易区分,越不容易分错$;$熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性