2024秋最新广东开放大学《数据分析与挖掘(本专)》形考作业试题题库、期末题库及答案
考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究
数据分析与挖掘(本专)
学校: 无
问题 1: 1. 标志是说明总体单位属性和特征的名称,统计指标是说明总体特征的。
选项:
答案: 正确
问题 2: 2. 统计调查时,调查单位和填报单位总是一致的。
选项:
答案: 错误
问题 3: 1. 在Python中,可以使用range
选项:
答案: 正确
问题 4: 2. 在Python中,使用def 保留字,可以删除列表中的元素( )
选项:
答案: 错误
问题 5: 1. 折线图比较适合描述和比较多组数据随时间变化的趋势,或者一组数据对另外一组数据的依赖程度。
选项:
答案: 正确
问题 6: 2. 绘制图形时触发事件button_release_event
选项:
答案: 错误
问题 7: 1. 下列常用的数据分析与挖掘工具中,属于商业软件的是?( )
选项:
• A. SPSS
• B. Python
• C. R语言
• D. Weka
答案: 请关注公众号【广开搜题】查看答案
问题 8: 2. 对于假设检验,下列说法正确的是:( )
选项:
• A. 以结构风险最小为原则
• B. 主要用于分类问题的归类等
• C. 知识和结果的不可解释性
• D. 基于小概率事件原理
答案: 请关注公众号【广开搜题】查看答案
问题 9: 3. 下列关于贝叶斯定理描述错误的是:( )
选项:
• A. 主要用于分类问题的归类等
• B. 主要用来确定群组内部和群租间的相似度和相异度
• C. 一种非常成熟的统计学分类方法
• D. 朴素贝叶斯分类方法可以跟决策树和神经网络算法相媲美。
答案: 请关注公众号【广开搜题】查看答案
问题 10: 4. 2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )
选项:
• A. 神经网络
• B. 回归分析
• C. 假设检验
• D. 决策树
答案: 请关注公众号【广开搜题】查看答案
问题 11: 5. 下列不是对决策树CHAID算法的描述的选项是?( )
选项:
• A. SQL)
• B. CART
• C. CHAID
• D. ID3
答案: 请关注公众号【广开搜题】查看答案
问题 12: 6. 不属于Python语言代码特点的是:( )
选项:
• A. 易维护性
• B. 简洁性
• C. 不可移植性
• D. 易读性
答案: 请关注公众号【广开搜题】查看答案
问题 13: 7. 下列对决策树ID3算法的描述不正确的选项是?( )
选项:
• A. 基于信息熵来选择最佳测试属性
• B. 根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性
• C. 利用卡方检验来选择对因变量最有影响的自变量
• D. 样本集的划分依据测试属性的取值进行
答案: 请关注公众号【广开搜题】查看答案
问题 14: 8. 在回归分析中,下列哪个选项不属于线性回归( )
选项:
• A. 分段回归
• B. 一元线性回归
• C. 多个因变量与多个自变量的回归
• D. 多元线性回归
答案: 请关注公众号【广开搜题】查看答案
问题 15: 9. 在回归分析中,不属于参数估计方法改进方向的选项是?( )
选项:
• A. 偏最小二乘回归
• B. 主成分回归
• C. 岭回归
• D. 非线性回归
答案: 请关注公众号【广开搜题】查看答案
问题 16: 10. 关于神经网络,描述错误的选项是?( )
选项:
• A. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联
• B. 大规模串行结构和信息的串行处理
• C. 主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习
• D. 知识和结果的不可解释性
答案: 请关注公众号【广开搜题】查看答案
问题 17: 11. 通常情况下,神经网络不会应用在下列哪个领域?( )
选项:
• A. 预测系统
• B. 统计分析
• C. 信号处理
• D. 模式识别
答案: 请关注公众号【广开搜题】查看答案
问题 18: 12. 关于支持向量机,下列说法正确的选项是?( )
选项:
• A. 知识和结果的不可解释性
• B. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
• C. 大规模串行结构和信息的串行处理
• D. 通过输入多个非线性模型以及不同模型之间的加权互联
答案: 请关注公众号【广开搜题】查看答案
问题 19: 13. 如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( )
选项:
• A. 应用部署
• B. 模型构建与评估
• C. 明确数据挖掘目标
• D. 数据收集与清洗
答案: 请关注公众号【广开搜题】查看答案
问题 20: 14. 下列选项中,不是对支持向量机的描述的是?( )
选项:
• A. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面
• B. 以结构风险最小为原则
• C. 训练数据较大
• D. 基于小概率事件原理
答案: 请关注公众号【广开搜题】查看答案
问题 21: 15. 采用假设检验的方法观测事件并下结论(在一定的显著性水平下得出的)时,有可能会给出错误判断。下列描述不正确的是?( )
选项:
• A. 当原假设为真时,却否定它而犯的错误,即拒绝正确假设的错误,也叫弃真错误,通常也叫α错误
• B. α错误和β错误在其他条件不变的情况下是相反的,即α增大时,β就减小;α减小时,β就增大。α错误容易受数据分析人员的控制
• C. 当原假设为假时,却肯定它而犯的错误,即接受错误假设的错误,也叫纳伪错误,通常也叫β错误
• D. α错误和β错误在其他条件不变的情况下是一致的,即α增大时,β就增大;α减小时,β就减小。α错误容易受数据分析人员的控制
答案: 请关注公众号【广开搜题】查看答案
问题 22: 16. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述?( )
选项:
• A. 数据分析更重视结合业务知识解读统计结果
• B. 数据分析需要有过硬的数学功底和编程技术
• C. 数据分析更重视模型或规则的构建
• D. 数据分析是技术性的“采矿”过程,发现未知的模式和规律
答案: 请关注公众号【广开搜题】查看答案
问题 23: 17. 下列常用的数据分析与挖掘工具中,不属于开源工具的是?( )
选项:
• A. SPSS
• B. R语言
• C. Weka
• D. Python
答案: 请关注公众号【广开搜题】查看答案
问题 24: 18. 下列对数据挖掘的描述不正确的选项是?( )
选项:
• A. 贝叶斯分类方法(Bayesian Classifier)是非常成熟的统计学分类方法,它主要用来预测类成员间关系的可能性。
• B. 神经网络(Neural Network)是通过数学算法来模仿人脑思维的抽象计算模型,它是数据挖掘中机器学习的典型代表。
• C. 回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具.
• D. 关联规则经过划分后,每个群组内部各对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。
答案: 请关注公众号【广开搜题】查看答案
问题 25: 19. 下列不是对决策树CHAID算法的描述的选项是?( )
选项:
• A. 检验标准是基尼系数(Gini)等不纯度的指标
• B. 应用的前提是因变量为类别型变量(Category)
• C. 利用卡方检验来选择对因变量最有影响的自变量
• D. 依据局部最优原则
答案: 请关注公众号【广开搜题】查看答案
问题 26: 20. 有一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别。为了解决这个问题,同学们马上简单的统计了7位同学的相关特征数据。那么请问,要解决老师的问题,采用哪种数据挖掘方法最合适?( )
选项:
• A. 聚类分析
• B. 假设检验
• C. 决策树
• D. 神经网络
答案: 请关注公众号【广开搜题】查看答案
问题 27: 21. 数据挖掘流程的操作步骤中,不包括以下哪种?( )
选项:
• A. 构建模型
• B. 绘制表格
• C. 应用部署
• D. 模型评估
答案: 请关注公众号【广开搜题】查看答案
问题 28: 22. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?( )
选项:
• A. 数据挖掘是技术性的“采矿”过程,发现未知的模式和规律
• B. 数据挖掘需要有过硬的数学功底和编程技术
• C. 数据挖掘更重视模型或规则的构建
• D. 数据挖掘侧重于实际的业务知识
答案: 请关注公众号【广开搜题】查看答案
问题 29: 23. 下列描述中,不属于神经网络的特点的是?( )
选项:
• A. 大规模并行结构和信息的并行处理
• B. 完美的知识和结果的解释性
• C. 良好的自适应性、自组织性和高容错性
• D. 较强的学习、记忆和识别功能
答案: 请关注公众号【广开搜题】查看答案
问题 30: 24. 2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )
选项:
• A. 决策树
• B. 支持向量机
• C. 神经网络
• D. 假设检验
答案: 请关注公众号【广开搜题】查看答案
问题 31: 25. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( )
选项:
• A. 数据分析侧重于实际的业务知识
• B. 数据分析属于描述和探索性分析,评估现状和修正不足
• C. 数据分析需要有过硬的数学功底和编程技术
• D. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能
答案: 请关注公众号【广开搜题】查看答案
问题 32: 26. 数据挖掘流程的操作步骤有几种?( )
选项:
• A. 构建模型
• B. 应用部署
• C. 模型评估
• D. 数据清洗
答案: 请关注公众号【广开搜题】查看答案
问题 33: 27. 免费的数据分析与挖掘工具有下列哪几种:( )
选项:
• A. R语言
• B. Weka
• C. Python
• D. SPSS
答案: 请关注公众号【广开搜题】查看答案
问题 34: 28. 相对于数据分析来说,数据挖掘需要掌握的技能有:( )
选项:
• A. 良好的数学功底
• B. 基本的统计学知识
• C. 优秀的编程能力
• D. 常用可视化图表展现的能力
答案: 请关注公众号【广开搜题】查看答案
问题 35: 29. 下列不属于数据挖掘技术的有:( )
选项:
• A. PowerBI
• B. SQL
• C. 假设检验
• D. Weka
答案: 请关注公众号【广开搜题】查看答案
问题 36: 30. 下面选项中,属于列表的方法的是( )。
选项:
• A. PowerBI
• B. 假设检验
• C. Weka
• D. 贝叶斯定理
答案: 请关注公众号【广开搜题】查看答案
问题 37: 31. 属于数据分析与数据挖掘工具的有:( )
选项:
• A. R语言
• B. Python
• C. SQL
• D. Weka
答案: 请关注公众号【广开搜题】查看答案
问题 38: 32. 下列属于数据挖掘技术的有:( )
选项:
• A. 神经网络
• B. 决策树
• C. 关联规则
• D. 回归分析
答案: 请关注公众号【广开搜题】查看答案
问题 39: 33. 下列属于数据挖掘技术的有:( )
选项:
• A. 神经网络
• B. SPSS
• C. 支持向量机
• D. 决策树
答案: 请关注公众号【广开搜题】查看答案
问题 40: 34. 下列选项中,属于数据挖掘的成熟技术的是:( )
选项:
• A. 神经网络
• B. 支持向量机
• C. 决策树
• D. 聚类方法
答案: 请关注公众号【广开搜题】查看答案
问题 41: 35. 相对于数据分析来说,数据挖掘更加侧重于哪些层面:( )
选项:
• A. 实际的业务知识
• B. 技术的实现
• C. 运用技术手段从海量的数据中发现未知的模式和规律
• D. 将数据和业务紧密结合,实现功效的最大化
答案: 请关注公众号【广开搜题】查看答案
问题 42: 36. 下列选项中,不是对支持向量机的描述的是?( )
选项:
• A. 以结构风险最小为原则
• B. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面
• C. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
• D. 训练数据较小
答案: 请关注公众号【广开搜题】查看答案
问题 43: 37. 沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )
选项:
• A. 决策树
• B. 神经网络
• C. 关联规则
• D. 聚类分析
答案: 请关注公众号【广开搜题】查看答案
问题 44: 38. 不属于数据分析与数据挖掘工具的有:( )
选项:
• A. SPSS
• B. Python
• C. R语言
• D. SQL
答案: 请关注公众号【广开搜题】查看答案
问题 45: 39. 下列关于聚类分析不正确的说法是:( )
选项:
• A. 运用层次的方法, 依次让最相似的数据对象两两合并,这样不断地合并,最后就形成了一棵聚类树
• B. 按照相似性和相异性进行划分后,每个群组内部各对象间的相似度会很高,而不同群组对象之间的相异度很低
• C. 直接作为模型对观察对象进行群体划分
• D. 数据处理阶段用作数据探索的工具,通过聚类发现数据间的深层次的关系等
答案: 请关注公众号【广开搜题】查看答案
问题 46: 40. Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )
选项:
• A. 1991年
• B. 1989年
• C. 1996年
• D. 1993年
答案: 请关注公众号【广开搜题】查看答案
问题 47: 41. 决策树技术对数据的分布甚至缺失非常宽容,不容易受到极值的影响。( )
选项:
答案: 请关注公众号【广开搜题】查看答案
问题 48: 42. 关联规则数据挖掘的主要目的是找出数据集中同时出现的关系( )
选项:
答案: 请关注公众号【广开搜题】查看答案
问题 49: 43. 目前,最常用的3种决策树算法分别是CHAID、CART和ID3。( )
选项:
答案: 请关注公众号【广开搜题】查看答案
问题 50: 44. 从广义角度来说,数据分析和数据挖掘包含的范畴是一致的。( )
选项:
答案: 请关注公众号【广开搜题】查看答案
问题 51: 45. 神经网络对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合。( )
选项:
答案: 请关注公众号【广开搜题】查看答案
问题 52: 46. 支持度和关联度是衡量关联规则强度的两个重要指标( )
选项:
答案: 请关注公众号【广开搜题】查看答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。