相关题目
36.(单选题)NavigableString对象无法编辑,但可以用( )方法替换。
35. (单选题)正则表达式r'(?).*?(?=) 的作用是( )。
34.(单选题)使用urllib3库的request函数获取网页源代码过程中,会遇到浏览器兼容问题,下面哪个headers参数能解决此类问题?( )
33.(单选题)HTTP头部信息中,( )告诉服务器请求是从哪个页面链接过来的。
32.(单选题)BeautifulSoup对象可以使用( )方法搜索满足条件的所有结点,并返回一个列表。
31. (单选题)爬虫程序要遵守网站的相关规定,在浏览器中打开网站后,在网站首页的地址后面添加( ),如果网站设置了访问许可,按回车就可以看到网站的相关协议,从而确定可合法爬取的内容。
30.(单选题)下列程序要想获取相关网页的内容,可使用的语句是( )。import requestsurl='http://www.tipdm.com/tipdm/index.html'rqg=requests.get(url)rqg.encoding= 'utf-8 '
29. (单选题)HTTP状态码(HTTP Status Code)是用来表示网页服务器HTTP响应状态的3位数字代码。当状态码为500时,表示下面哪个信息?
28.(单选题)( )又称网络蜘蛛、网络机器人,是一个自动下载网页的计算机程序或自动化脚本。
27. (单选题)可以读取JSON文件中的内容用来进行数据分析,JSON对象转换为Pathon对象的过程称为( )。
