相关题目
39.(单选题)HTTP头部信息中,( )表示客户端的身份标识字符串。包括服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等信息。
38. (单选题)爬取的文本可以存储为JSON文件,Pathon对象转换为JSON对象的过程称为( )。
37. (单选题)写入JSON文件时需要先( )Python对象,否则报错。
36.(单选题)NavigableString对象无法编辑,但可以用( )方法替换。
35. (单选题)正则表达式r'(?).*?(?=) 的作用是( )。
34.(单选题)使用urllib3库的request函数获取网页源代码过程中,会遇到浏览器兼容问题,下面哪个headers参数能解决此类问题?( )
33.(单选题)HTTP头部信息中,( )告诉服务器请求是从哪个页面链接过来的。
32.(单选题)BeautifulSoup对象可以使用( )方法搜索满足条件的所有结点,并返回一个列表。
31. (单选题)爬虫程序要遵守网站的相关规定,在浏览器中打开网站后,在网站首页的地址后面添加( ),如果网站设置了访问许可,按回车就可以看到网站的相关协议,从而确定可合法爬取的内容。
30.(单选题)下列程序要想获取相关网页的内容,可使用的语句是( )。import requestsurl='http://www.tipdm.com/tipdm/index.html'rqg=requests.get(url)rqg.encoding= 'utf-8 '
