国开搜题

中国大学MOOCPython爬虫技术考核作业参考原题试题

来源：百年教育职业培训中心　更新时间：2024-12-19 02:18:30

2024秋最新《中国大学MOOCPython爬虫技术考核作业参考原题试题》形考作业试题题库、期末题库考试说明:本人针对该科精心汇总了历年题库及答案，形成一个完整的题库，并且每年都在更新。该题库对考生的

2024秋最新《中国大学MOOCPython爬虫技术考核作业参考原题试题》形考作业试题题库、期末题库

考试说明:本人针对该科精心汇总了历年题库及答案，形成一个完整的题库，并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用，会给您节省大量的时间。做考题时，利用本文档中的查找工具，把考题中的关键字输到查找工具的查找内容框内，就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案，敬请查看。

课程题目试题是随机的，请按题目关键词查找（或按Ctrl+F输入题目中的关键词，尽量不要输入整个题目，不要复制空格，连续的几个字就行）

本文由【大象答案】微信公众号提供，禁止复制盗取，违者必究

本文由【大象答案】微信公众号提供，禁止复制盗取，违者必究

本文由【大象答案】微信公众号提供，禁止复制盗取，违者必究

Python爬虫技术

学校: 无

问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为（）

选项:

• A. F12

• B. F11

• C. 鼠标右击，点“检查”

• D. Ctrl+Shift+I

答案: F11

问题 2: 2. 下列不属于浏览器开发者模式面板的为（）

选项:

• A. Elements

• B. Console

• C. Sources

• D. headers

答案: headers

问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是（）

选项:

• A. 元素面板可查看元素在页面的对应位置

• B. 源代码面板可以查看HTML源码

• C. 网络面板可以查看HTML源码

• D. 网络面板可以查看HTTP头部信息

答案: 网络面板可以查看HTML源码

问题 4: 4. 爬虫爬取的是网站后台的数据。

选项:

答案: 错误

问题 5: 5. 下列robots.txt文件中，User-agent后面跟的是爬虫的名称，Disallow后面跟着可以爬虫的网页

选项:

答案: 错误

问题 6: 6. 每个网站都有robots.txt文件

选项:

答案: 错误

问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 9: 1. 下列 Python库或模块中，支持正则表达式语法的是____。

选项:

• A. bs4

• B. lxml

• C. re

• D. json

答案: 请关注公众号【大象答案】查看答案

问题 10: 2. 下列选取节点的表达式中，代表着从根节点开始选取的是____。

选项:

• A. /

• B. //

• C. name

• D. @

答案: 请关注公众号【大象答案】查看答案

问题 11: 3. 下列选项中，属于非结构化数据的是：

选项:

• A. 图像

• B. HTML

• C. XML

• D. JSON

答案: 请关注公众号【大象答案】查看答案

问题 12: 4. 下列选项中，属于结构化数据的是____。

选项:

• A. 图像

• B. 文本

• C. 办公文档

• D. JSON

答案: 请关注公众号【大象答案】查看答案

问题 13: 5. 正则表达式字符集中，（）表示数字

选项:

• A. \d

• B. \D

• C. \s

• D. \w

答案: 请关注公众号【大象答案】查看答案

问题 14: 6. python中，正则表达式需要引入的模式是（）

选项:

• A. re

• B. requests

• C. os

• D. bs4

答案: 请关注公众号【大象答案】查看答案

问题 15: 7. 正则表达式“[^a-z]”，可以匹配下列的字符串为（）。

选项:

• A. a

• B. z

• C. 2

• D. m

答案: 请关注公众号【大象答案】查看答案

问题 16: 8. 如果路径表达式以“/”开始，那么该路径就代表着到达某个节点的绝对路径。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 17: 9. 创建 BeautifulSoup类实例时，如果没有明确指定解析器，那么该实例肯定会选择Python标准库。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 18: 10. 在使用bs4库调用find()方法查找节点时，只能将字符串作为参数。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 19: 11. 路径表达式是唯一的，只能从根节点开始搜索。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 21: 1. 下列selenium库的方法中，通过元素名称进行多元素定位的是（）

选项:

• A. find_element_by_name

• B. find_elements_by_name

• C. find_elements_by_id

• D. find_elements_by_class_name

答案: 请关注公众号【大象答案】查看答案

问题 22: 2. 下列方法中，获取当前页渲染后的源代码是（）

选项:

• A. close()

• B. quit()

• C. page_source

• D. title

答案: 请关注公众号【大象答案】查看答案

问题 23: 3. 查看下面表单的示例程序：
...
若要使用WebDriver定位上述元素，可以使用如下（）方法实现。

选项:

• A. find_element_by_id

• B. find_element_by_name

• C. find_elements_by_link_text

• D. find_elements_by_tag_name

答案: 请关注公众号【大象答案】查看答案

问题 24: 4. seleinum支持浏览器的功能，可以直接被用来执行命令。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中，如果页面没有加载完，此方法会一直阻塞等待。

选项:

答案: 请关注公众号【大象答案】查看答案

中国大学MOOCPython爬虫技术考核作业参考原题试题

来源：百年教育职业培训中心 更新时间：2024-12-19 02:18:30

来源：百年教育职业培训中心　更新时间：2024-12-19 02:18:30