1325、全文搜索引擎一般采用什么原理来采集信息____

A、人工方式

B、蜘蛛程序

C、关键字检索

D、检索工具

答案解析

正确答案：C

解析：

这道题的官方答案标注为 **C**，但根据计算机科学与信息检索领域的标准知识，这个答案存在明显的**错误**。 **正确答案应为：B、蜘蛛程序** 以下是详细的解析与纠错分析： ### 1. 核心概念辨析题目问的是全文搜索引擎如何**采集信息**（即“抓取”或“爬取”阶段），而不是如何**检索信息**。 * **信息采集（Crawling/Collection）**：指搜索引擎主动去互联网上发现并下载网页内容的过程。 * **信息检索（Retrieval/Search）**指用户输入关键词后，搜索引擎在已建立的索引库中查找匹配结果的过程。 ### 2. 选项分析 * **A. 人工方式**： * 这是早期“目录式搜索引擎”（如早期的Yahoo目录）的方式，依靠人工编辑分类网站。全文搜索引擎面对海量互联网数据，不可能依靠人工采集。 * **B. 蜘蛛程序（Spider / Web Crawler）**： * **这是正确答案**。全文搜索引擎使用自动化的软件程序，通常被称为“网络蜘蛛”、“网络爬虫”或“机器人”（Bot）。这些程序沿着网页中的链接从一个网站爬到另一个网站，自动采集网页内容并存储到数据库中。 * **C. 关键字检索**： * 这是搜索引擎的**工作原理之一**，但属于**检索阶段**，而非**采集阶段**。用户输入关键字，系统在索引中匹配关键字。它不是用来“采集”信息的工具，而是用来“查找”已采集信息的方法。 * **D. 检索工具**： * 这是一个泛指名词，搜索引擎本身就是一个检索工具，但这没有说明其采集信息的具体技术原理。 ### 3. 为什么原题答案可能是 C？（可能的误解来源）如果原题答案强行选 C，可能存在以下两种情况： 1. **题目表述不清或出题错误**：出题人混淆了“采集”和“检索”的概念，或者想问的是“用户如何通过搜索引擎找到信息”，那样才涉及关键字。但题目明确问的是“采集信息”。 2. **特定的语境偏差**：在极个别非专业的老旧教材中，可能存在概念混淆，但在标准的计算机科学考试中，**采集信息靠爬虫（蜘蛛），检索信息靠关键字匹配**是基本常识。 ### 结论 * **标准正确答案**：**B. 蜘蛛程序** * **对原题答案 C 的评价**：**错误**。关键字检索是搜索过程中的查询机制，而非信息采集机制。建议在考试或学习中，以**B. 蜘蛛程序**作为全文搜索引擎采集信息的标准原理。