百年教育职业培训中心 百年教育学习服务平台
国家开放大学|国开搜题

超尔星学雅习通Python爬虫技术作业答案

来源: 更新时间:

Python爬虫技术学校:无问题1:1.谷歌浏览器开发者模式打开方式不正确的为()选项:•A.F12•B.F11•C.鼠标右击,点“检查”&bul

Python爬虫技术

学校: 无

问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为()

选项:

A. F12

B. F11

C. 鼠标右击,点“检查”

D. Ctrl+Shift+I

答案: F11

问题 2: 2. 下列不属于浏览器开发者模式面板的为()

选项:

A. Elements

B. Console

C. Sources

D. headers

答案: headers

问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是()

选项:

A. 元素面板可查看元素在页面的对应位置

B. 源代码面板可以查看HTML源码

C. 网络面板可以查看HTML源码

D. 网络面板可以查看HTTP头部信息

答案: 网络面板可以查看HTML源码

问题 4: 4. 爬虫爬取的是网站后台的数据。

选项:

答案: 错误

问题 5: 5. 下列robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着可以爬虫的网页

选项:

答案: 错误

问题 6: 6. 每个网站都有robots.txt文件

选项:

答案: 错误

问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 9: 1. 下列 Python库或模块中,支持正则表达式语法的是____。

选项:

A. bs4

B. lxml

C. re

D. json

答案: 请关注公众号【渝粤搜题】查看答案

问题 10: 2. 下列选取节点的表达式中,代表着从根节点开始选取的是____。

选项:

A. /

B. //

C. name

D. @

答案: 请关注公众号【渝粤搜题】查看答案

问题 11: 3. 下列选项中,属于非结构化数据的是:

选项:

A. 图像

B. HTML

C. XML

D. JSON

答案: 请关注公众号【渝粤搜题】查看答案

问题 12: 4. 下列选项中,属于结构化数据的是____。

选项:

A. 图像

B. 文本

C. 办公文档

D. JSON

答案: 请关注公众号【渝粤搜题】查看答案

问题 13: 5. 正则表达式字符集中,( )表示数字

选项:

A. \d

B. \D

C. \s

D. \w

答案: 请关注公众号【渝粤搜题】查看答案

问题 14: 6. python中,正则表达式需要引入的模式是( )

选项:

A. re

B. requests

C. os

D. bs4

答案: 请关注公众号【渝粤搜题】查看答案

问题 15: 7. 正则表达式“[^a-z]”,可以匹配下列的字符串为( )。

选项:

A. a

B. z

C. 2

D. m

答案: 请关注公众号【渝粤搜题】查看答案

问题 16: 8. 如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 17: 9. 创建 BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 18: 10. 在使用bs4库调用find()方法查找节点时,只能将字符串作为参数。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 19: 11. 路径表达式是唯一的,只能从根节点开始搜索。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 21: 1. 下列selenium库的方法中,通过元素名称进行多元素定位的是()

选项:

A. find_element_by_name

B. find_elements_by_name

C. find_elements_by_id

D. find_elements_by_class_name

答案: 请关注公众号【渝粤搜题】查看答案

问题 22: 2. 下列方法中,获取当前页渲染后的源代码是()

选项:

A. close()

B. quit()

C. page_source

D. title

答案: 请关注公众号【渝粤搜题】查看答案

问题 23: 3. 查看下面表单的示例程序:
...
若要使用WebDriver定位上述元素,可以使用如下()方法实现。

选项:

A. find_element_by_id

B. find_element_by_name

C. find_elements_by_link_text

D. find_elements_by_tag_name

答案: 请关注公众号【渝粤搜题】查看答案

问题 24: 4. seleinum支持浏览器的功能,可以直接被用来执行命令。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中,如果页面没有加载完,此方法会一直阻塞等待。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

电话咨询