2024秋最新《中国大学MOOCPython爬虫技术考核作业参考原题试题》形考作业试题题库、期末题库
考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

Python爬虫技术
学校: 无
问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为()
选项:
• A. F12
• B. F11
• C. 鼠标右击,点“检查”
• D. Ctrl+Shift+I
答案: F11
问题 2: 2. 下列不属于浏览器开发者模式面板的为()
选项:
• A. Elements
• B. Console
• C. Sources
• D. headers
答案: headers
问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是()
选项:
• A. 元素面板可查看元素在页面的对应位置
• B. 源代码面板可以查看HTML源码
• C. 网络面板可以查看HTML源码
• D. 网络面板可以查看HTTP头部信息
答案: 网络面板可以查看HTML源码
问题 4: 4. 爬虫爬取的是网站后台的数据。
选项:
答案: 错误
问题 5: 5. 下列robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着可以爬虫的网页
选项:
答案: 错误
问题 6: 6. 每个网站都有robots.txt文件
选项:
答案: 错误
问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 9: 1. 下列 Python库或模块中,支持正则表达式语法的是____。
选项:
• A. bs4
• B. lxml
• C. re
• D. json
答案: 请关注公众号【大象答案】查看答案
问题 10: 2. 下列选取节点的表达式中,代表着从根节点开始选取的是____。
选项:
• A. /
• B. //
• C. name
• D. @
答案: 请关注公众号【大象答案】查看答案
问题 11: 3. 下列选项中,属于非结构化数据的是:
选项:
• A. 图像
• B. HTML
• C. XML
• D. JSON
答案: 请关注公众号【大象答案】查看答案
问题 12: 4. 下列选项中,属于结构化数据的是____。
选项:
• A. 图像
• B. 文本
• C. 办公文档
• D. JSON
答案: 请关注公众号【大象答案】查看答案
问题 13: 5. 正则表达式字符集中,( )表示数字
选项:
• A. \d
• B. \D
• C. \s
• D. \w
答案: 请关注公众号【大象答案】查看答案
问题 14: 6. python中,正则表达式需要引入的模式是( )
选项:
• A. re
• B. requests
• C. os
• D. bs4
答案: 请关注公众号【大象答案】查看答案
问题 15: 7. 正则表达式“[^a-z]”,可以匹配下列的字符串为( )。
选项:
• A. a
• B. z
• C. 2
• D. m
答案: 请关注公众号【大象答案】查看答案
问题 16: 8. 如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 17: 9. 创建 BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 18: 10. 在使用bs4库调用find()方法查找节点时,只能将字符串作为参数。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 19: 11. 路径表达式是唯一的,只能从根节点开始搜索。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 21: 1. 下列selenium库的方法中,通过元素名称进行多元素定位的是()
选项:
• A. find_element_by_name
• B. find_elements_by_name
• C. find_elements_by_id
• D. find_elements_by_class_name
答案: 请关注公众号【大象答案】查看答案
问题 22: 2. 下列方法中,获取当前页渲染后的源代码是()
选项:
• A. close()
• B. quit()
• C. page_source
• D. title
答案: 请关注公众号【大象答案】查看答案
问题 23: 3. 查看下面表单的示例程序:
...
若要使用WebDriver定位上述元素,可以使用如下()方法实现。
选项:
• A. find_element_by_id
• B. find_element_by_name
• C. find_elements_by_link_text
• D. find_elements_by_tag_name
答案: 请关注公众号【大象答案】查看答案
问题 24: 4. seleinum支持浏览器的功能,可以直接被用来执行命令。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中,如果页面没有加载完,此方法会一直阻塞等待。
选项:
答案: 请关注公众号【大象答案】查看答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。