练习中心
顺序练习
按照章节顺序依次练习所有题目,适合系统学习
组卷考试
随机抽取题目进行练习,适合巩固知识和检验学习效果
错题重做
针对做错的题目进行重点练习,强化薄弱环节
章节练习
选择特定章节进行练习,针对性提升某一知识点
收藏题目
集中练习收藏的重点题目,加深理解和记忆
考试记录
按题型或难度进行专项练习,突破学习瓶颈
题型练习
按照章节题型获取题目练习,适合系统学习
小练习
随机抽取题目练习
高频错题
按题目做错次数,加深记忆
题目预览
单选题
1、下列不属于常见爬虫类型的是( )。
A
浅层网络爬虫
B
聚焦网络爬虫
C
增量式网络爬虫
D
通用网络爬虫
单选题
2、下列哪项不属于解析网页的库?( )
A
lxml
B
beautifulsoup4
C
正则表达式
D
requests
单选题
3、通过设置HTTP请求的哪个参数可以实现伪装成浏览器访问网页?( )
A
params
B
data
C
headers
D
timeout
单选题
4、下列哪个函数可以实现合并URL?( )
A
urlpase()
B
urlencode()
C
urljoin()
D
quote()
单选题
5、下列不属于Response对象属性的是( )。
A
content
B
txt
C
text
D
encoding
单选题
6、下列不属于HTML标签的是( )。
A
href
B
head
C
a
D
li
单选题
7、lxml库中选取属性的语法是( )。
A
@
B
.
C
*
D
//
单选题
8、能够在字符串“aabaaabaaaab”中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式为( )。
A
a{1,3}b
B
aa??b
C
aaa??b
D
a*?b
单选题
9、beautifulsoup4 库中遍历整个HTML文件,按照条件返回所有匹配的节点元素的方法是( )
A
find()
B
select()
C
find_all()
D
search()
单选题
10、下列关于XPath描述错误的是( )。
A
text()方法可提取节点的文本内容
B
text()方法可用于选取包含指定文本内容的节点
C
contains()方法可用于选取以特定值开头的节点
D
and可用于选取同时包含两种指定值的节点