百年教育职业培训中心 百年教育学习服务平台
国开搜题

中国大学MOOCPython爬虫技术考核作业参考原题试题

来源: 更新时间:

2024秋最新《中国大学MOOCPython爬虫技术考核作业参考原题试题》形考作业试题题库、期末题库考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的


2024秋最新《中国大学MOOCPython爬虫技术考核作业参考原题试题》形考作业试题题库、期末题库

考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。

课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

Python爬虫技术

学校: 无

问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为()

选项:

A. F12

B. F11

C. 鼠标右击,点检查

D. Ctrl+Shift+I

答案: F11

问题 2: 2. 下列不属于浏览器开发者模式面板的为()

选项:

A. Elements

B. Console

C. Sources

D. headers

答案: headers

问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是()

选项:

A. 元素面板可查看元素在页面的对应位置

B. 源代码面板可以查看HTML源码

C. 网络面板可以查看HTML源码

D. 网络面板可以查看HTTP头部信息

答案: 网络面板可以查看HTML源码

问题 4: 4. 爬虫爬取的是网站后台的数据。

选项:

答案: 错误

问题 5: 5. 下列robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着可以爬虫的网页

选项:

答案: 错误

问题 6: 6. 每个网站都有robots.txt文件

选项:

答案: 错误

问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 9: 1. 下列 Python库或模块中,支持正则表达式语法的是____。

选项:

A. bs4

B. lxml

C. re

D. json

答案: 请关注公众号【大象答案】查看答案

问题 10: 2. 下列选取节点的表达式中,代表着从根节点开始选取的是____。

选项:

A. /

B. //

C. name

D. @

答案: 请关注公众号【大象答案】查看答案

问题 11: 3. 下列选项中,属于非结构化数据的是:

选项:

A. 图像

B. HTML

C. XML

D. JSON

答案: 请关注公众号【大象答案】查看答案

问题 12: 4. 下列选项中,属于结构化数据的是____。

选项:

A. 图像

B. 文本

C. 办公文档

D. JSON

答案: 请关注公众号【大象答案】查看答案

问题 13: 5. 正则表达式字符集中,( )表示数字

选项:

A. \d

B. \D

C. \s

D. \w

答案: 请关注公众号【大象答案】查看答案

问题 14: 6. python中,正则表达式需要引入的模式是( )

选项:

A. re

B. requests

C. os

D. bs4

答案: 请关注公众号【大象答案】查看答案

问题 15: 7. 正则表达式“[^a-z]”,可以匹配下列的字符串为( )。

选项:

A. a

B. z

C. 2

D. m

答案: 请关注公众号【大象答案】查看答案

问题 16: 8. 如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 17: 9. 创建 BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 18: 10. 在使用bs4库调用find()方法查找节点时,只能将字符串作为参数。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 19: 11. 路径表达式是唯一的,只能从根节点开始搜索。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 21: 1. 下列selenium库的方法中,通过元素名称进行多元素定位的是()

选项:

A. find_element_by_name

B. find_elements_by_name

C. find_elements_by_id

D. find_elements_by_class_name

答案: 请关注公众号【大象答案】查看答案

问题 22: 2. 下列方法中,获取当前页渲染后的源代码是()

选项:

A. close()

B. quit()

C. page_source

D. title

答案: 请关注公众号【大象答案】查看答案

问题 23: 3. 查看下面表单的示例程序:
...
若要使用WebDriver定位上述元素,可以使用如下()方法实现。

选项:

A. find_element_by_id

B. find_element_by_name

C. find_elements_by_link_text

D. find_elements_by_tag_name

答案: 请关注公众号【大象答案】查看答案

问题 24: 4. seleinum支持浏览器的功能,可以直接被用来执行命令。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中,如果页面没有加载完,此方法会一直阻塞等待。

选项:

答案: 请关注公众号【大象答案】查看答案

电话咨询