8、简述Scrapy中Engine控制数据流的工作基本步骤。

答案解析

正确答案：答案:
(1) Engine 从Spider获取初始爬取列表的Request.
(2) Engine将要爬取的Request发送给Scheduler,通过Scheduler进行调度。
(3) Engine向Scheduler获取下一个要爬取的Request.
(4) Engine 将Request通过Downloader Middleware发送给Downloader.
(5)当网页下载完毕,Downloader 生成该网页的Response,并将其通过Downloader Middleware提交给Engine.
(6) Engine 将接收到Response通过Spider Middleware发送给Spider处理。
(7) Spider 解析响应,提取Item所需的数据和新的URL,并将Item和新的Request通过Spider Middleware提交给Engine。
(8) Engine 将Item发送给Item Pipeline,将新的Request发送给Scheduler.
(9)重复第(2) ~ (8) 步,直到Scheduler中没有Request, Engine 关闭该爬虫程序,爬取结束。

谁都快都哦都送的哦

扫码进入小程序
随时随地练习

8、简述Scrapy中Engine控制数据流的工作基本步骤。

答案解析

相关题目

选择练习分段

选择练习章节

组卷设置

考试记录