单选题
1325、全文搜索引擎一般采用什么原理来采集信息____
A
A、人工方式
B
B、蜘蛛程序
C
C、关键字检索
D
D、检索工具
答案解析
正确答案:C
解析:
这道题的官方答案标注为 **C**,但根据计算机科学与信息检索领域的标准知识,这个答案存在明显的**错误**。
**正确答案应为:B、蜘蛛程序**
以下是详细的解析与纠错分析:
### 1. 核心概念辨析
题目问的是全文搜索引擎如何**采集信息**(即“抓取”或“爬取”阶段),而不是如何**检索信息**。
* **信息采集(Crawling/Collection)**:指搜索引擎主动去互联网上发现并下载网页内容的过程。
* **信息检索(Retrieval/Search)**指用户输入关键词后,搜索引擎在已建立的索引库中查找匹配结果的过程。
### 2. 选项分析
* **A. 人工方式**:
* 这是早期“目录式搜索引擎”(如早期的Yahoo目录)的方式,依靠人工编辑分类网站。全文搜索引擎面对海量互联网数据,不可能依靠人工采集。
* **B. 蜘蛛程序(Spider / Web Crawler)**:
* **这是正确答案**。全文搜索引擎使用自动化的软件程序,通常被称为“网络蜘蛛”、“网络爬虫”或“机器人”(Bot)。这些程序沿着网页中的链接从一个网站爬到另一个网站,自动采集网页内容并存储到数据库中。
* **C. 关键字检索**:
* 这是搜索引擎的**工作原理之一**,但属于**检索阶段**,而非**采集阶段**。用户输入关键字,系统在索引中匹配关键字。它不是用来“采集”信息的工具,而是用来“查找”已采集信息的方法。
* **D. 检索工具**:
* 这是一个泛指名词,搜索引擎本身就是一个检索工具,但这没有说明其采集信息的具体技术原理。
### 3. 为什么原题答案可能是 C?(可能的误解来源)
如果原题答案强行选 C,可能存在以下两种情况:
1. **题目表述不清或出题错误**:出题人混淆了“采集”和“检索”的概念,或者想问的是“用户如何通过搜索引擎找到信息”,那样才涉及关键字。但题目明确问的是“采集信息”。
2. **特定的语境偏差**:在极个别非专业的老旧教材中,可能存在概念混淆,但在标准的计算机科学考试中,**采集信息靠爬虫(蜘蛛),检索信息靠关键字匹配**是基本常识。
### 结论
* **标准正确答案**:**B. 蜘蛛程序**
* **对原题答案 C 的评价**:**错误**。关键字检索是搜索过程中的查询机制,而非信息采集机制。
建议在考试或学习中,以**B. 蜘蛛程序**作为全文搜索引擎采集信息的标准原理。
相关知识点:
搜索引擎:关键字采集
题目纠错
计算机基础题库练习
相关题目
单选题
160、十进制数(-123)的原码表示为____。
单选题
159、某编码方案用10位二进制数对字符进行编码,最多可表示____个字符。
单选题
158、计算机中,浮点数由两部分组成;它们是____。
单选题
157、已知一补码为10000101,则其真值用二进制表示为____。
单选题
156、“32位微型计算机”中的32是指____。
单选题
155、在微机中,存储容量为5MB,指的是____。
单选题
154、ASCII码是对____进行编码的一种方案。
单选题
153、下列哪个数不是二进制数?
单选题
152、二进制数11转换成十进制数是____。
单选题
151、计算机中常用的英文词BytE,其中文意思是____。
