AI智能推荐题库-试题通 AI智能整理导入题库-试题通
×
首页 题库中心 2025年数字赋能基层自主数据应用建设技能竞赛 题目详情
CB65483FBBB00001F36118C0F2101D22
2025年数字赋能基层自主数据应用建设技能竞赛
331
单选题

以下哪项不属于相似性检索方法?

A
余弦相似性
B
欧式距离
C
BM25
D
曼哈顿距离

答案解析

正确答案:C

解析:

本题考查的是相似性检索方法的分类与辨析。\n\n首先明确核心概念:相似性检索(Similarity Search)是指在给定查询对象的前提下,从大规模数据集中检索出与之最相似(或最接近)的若干个对象。其基础是定义合适的相似性(similarity)或距离(distance)度量函数。通常,相似性值越大表示越相似(如余弦相似性),而距离值越小表示越相似(如欧式距离、曼哈顿距离)。二者可通过单调变换相互转化(例如,相似性 \u003d 1 / (1 + 距离)),因此在检索系统中常被统一视为相似性度量的实现方式。\n\n逐项分析选项:\n\nA:余弦相似性(Cosine Similarity) \n用于衡量两个非零向量在高维空间中的夹角余弦值,取值范围为[−1, 1],常用于文本向量(如TF-IDF、词嵌入)或特征向量的相似性计算。它是典型的相似性度量方法,广泛应用于向量相似性检索(如ANN搜索)。属于相似性检索方法。\n\nB:欧式距离(Euclidean Distance) \n是欧几里得空间中两点间的直线距离,属于经典的度量距离函数,满足非负性、同一性、对称性和三角不等式,是度量空间(metric space)的标准距离。在KNN、聚类及向量检索中直接用于相似性排序(距离越小越相似)。属于相似性检索方法。\n\nD:曼哈顿距离(Manhattan Distance) \n即L1距离,是各维度绝对差值之和。同样满足度量公理,适用于稀疏向量或具有网格结构的数据,在推荐系统、图像处理等领域用作相似性度量。属于相似性检索方法。\n\nC:BM25(Best Matching 25) \n是一种基于概率检索模型的**排序函数(ranking function)**,专用于信息检索(Information Retrieval)中的文档相关性排序。它结合词频(TF)、逆文档频率(IDF)和文档长度归一化,建模查询词与文档的相关概率,输出的是一个**相关性得分(relevance score)**,而非向量空间中的几何相似性或距离。BM25不依赖于向量嵌入或度量空间结构,也不满足距离度量的数学性质(如三角不等式),其本质是语言学与统计驱动的**关键词匹配排序模型**,属于传统IR模型,而非广义的“相似性检索方法”(该术语在现代检索语境中特指向量空间下的相似性计算与近似最近邻搜索)。\n\n因此,BM25虽用于检索排序,但其原理、输入形式(原始文本 vs 向量)、数学基础(概率模型 vs 度量空间)均与余弦相似性、欧式距离、曼哈顿距离有本质区别。题目问的是“不属于相似性检索方法”,C项符合题意。\n\n综上,正确答案为C。

相关知识点:

相似性检索BM25除外

题目纠错
2025年数字赋能基层自主数据应用建设技能竞赛

扫码进入小程序
随时随地练习

相关题目

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,各级调度人员应及时完成本单位年度、月度及临时作业计划的()、平衡和协调工作,按各类作业计划的报送要求完成相关上报、发布和备案工作。

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,监控管理中,各级调度人员应对职责范围内()进行统一运行监测与评估分析,识别、预警潜在问题。

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,值班管理中,交接班应(),如遇重大故障,可根据实际情况延缓交接,当天无法处理完成告警及故障,需要与下一值值班人员确认已交接清楚并签字确认。

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,各级信息运行部门应定期对所管辖的信息系统()进行统计、分析,统一规划信息系统运行方式和资源。

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,信息系统账号及权限管理坚持()原则,在加强授权管理同时,保障公司跨专业访问共享正常使用。

单选题

依据《中国南方电网有限责任公司信息系统运行维护管理办法》Q/CSG218001-2018,信息系统是指由计算机及其相关的和配套的设备、设施(含网络)构成的,按照一定的应用目标和规则对人机信息系统进行()处理的人机系统。

单选题

依据《中国南方电网有限责任公司互联网应用管理办法》Q/CSG218006-2018,对互联网网站、移动应用APP所属的软硬件运行环境、应用系统、系统数据进行实时监测预警,内容包括但不限于互联网应用状态可用性、()、虚假三无网站等信息。

单选题

依据《中国南方电网有限责任公司互联网应用管理办法》Q/CSG218006-2018,按照“谁发布、谁负责”的原则,待发布内容须经由本单位业务管理部门审核,确保内容发布()。

单选题

依据《中国南方电网有限责任公司互联网应用管理办法》Q/CSG218006-2018,互联网应用需制定专项灾备恢复应急预案,并定期开展演练,下列对应急演练周期描述正确的是()。

单选题

依据《中国南方电网有限责任公司网络安全管理办法》(Q/CSG218007-2018),实行网络安全问责的内部问责人员对象包括()。

关闭登录弹窗
专为自学备考人员打造
勾选图标
自助导入本地题库
勾选图标
多种刷题考试模式
勾选图标
本地离线答题搜题
勾选图标
扫码考试方便快捷
勾选图标
海量试题每日更新
波浪装饰图
欢迎登录试题通
可以使用以下方式扫码登陆
APP图标
使用APP登录
微信图标
使用微信登录
试题通小程序二维码
联系电话:
400-660-3606
试题通企业微信二维码