百年教育职业培训中心 百年教育学习服务平台
国家开放大学|国开搜题

广东开放大学形成性考核答案数据分析与挖掘(本专)作业答案

来源: 更新时间:

2024秋最新广东开放大学《数据分析与挖掘(本专)》形考作业试题题库、期末题库及答案考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试


2024秋最新广东开放大学《数据分析与挖掘(本专)》形考作业试题题库、期末题库及答案

考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。

课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)

本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【广开搜题】微信公众号提供,禁止复制盗取,违者必究

数据分析与挖掘(本专)

学校: 无

问题 1: 1. 标志是说明总体单位属性和特征的名称,统计指标是说明总体特征的。

选项:

答案: 正确

问题 2: 2. 统计调查时,调查单位和填报单位总是一致的。

选项:

答案: 错误

问题 3: 1. 在Python中,可以使用range

选项:

答案: 正确

问题 4: 2. 在Python中,使用def 保留字,可以删除列表中的元素( )

选项:

答案: 错误

问题 5: 1. 折线图比较适合描述和比较多组数据随时间变化的趋势,或者一组数据对另外一组数据的依赖程度。

选项:

答案: 正确

问题 6: 2. 绘制图形时触发事件button_release_event

选项:

答案: 错误

问题 7: 1. 下列常用的数据分析与挖掘工具中,属于商业软件的是?( )

选项:

A. SPSS

B. Python

C. R语言

D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 8: 2. 对于假设检验,下列说法正确的是:( )

选项:

A. 以结构风险最小为原则

B. 主要用于分类问题的归类等

C. 知识和结果的不可解释性

D. 基于小概率事件原理

答案: 请关注公众号【广开搜题】查看答案

问题 9: 3. 下列关于贝叶斯定理描述错误的是:( )

选项:

A. 主要用于分类问题的归类等

B. 主要用来确定群组内部和群租间的相似度和相异度

C. 一种非常成熟的统计学分类方法

D. 朴素贝叶斯分类方法可以跟决策树和神经网络算法相媲美。

答案: 请关注公众号【广开搜题】查看答案

问题 10: 4. 2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )

选项:

A. 神经网络

B. 回归分析

C. 假设检验

D. 决策树

答案: 请关注公众号【广开搜题】查看答案

问题 11: 5. 下列不是对决策树CHAID算法的描述的选项是?( )

选项:

A. SQL)

B. CART

C. CHAID

D. ID3

答案: 请关注公众号【广开搜题】查看答案

问题 12: 6. 不属于Python语言代码特点的是:( )

选项:

A. 易维护性

B. 简洁性

C. 不可移植性

D. 易读性

答案: 请关注公众号【广开搜题】查看答案

问题 13: 7. 下列对决策树ID3算法的描述不正确的选项是?( )

选项:

A. 基于信息熵来选择最佳测试属性

B. 根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性

C. 利用卡方检验来选择对因变量最有影响的自变量

D. 样本集的划分依据测试属性的取值进行

答案: 请关注公众号【广开搜题】查看答案

问题 14: 8. 在回归分析中,下列哪个选项不属于线性回归( )

选项:

A. 分段回归

B. 一元线性回归

C. 多个因变量与多个自变量的回归

D. 多元线性回归

答案: 请关注公众号【广开搜题】查看答案

问题 15: 9. 在回归分析中,不属于参数估计方法改进方向的选项是?( )

选项:

A. 偏最小二乘回归

B. 主成分回归

C. 岭回归

D. 非线性回归

答案: 请关注公众号【广开搜题】查看答案

问题 16: 10. 关于神经网络,描述错误的选项是?( )

选项:

A. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联

B. 大规模串行结构和信息的串行处理

C. 主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习

D. 知识和结果的不可解释性

答案: 请关注公众号【广开搜题】查看答案

问题 17: 11. 通常情况下,神经网络不会应用在下列哪个领域?( )

选项:

A. 预测系统

B. 统计分析

C. 信号处理

D. 模式识别

答案: 请关注公众号【广开搜题】查看答案

问题 18: 12. 关于支持向量机,下列说法正确的选项是?( )

选项:

A. 知识和结果的不可解释性

B. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合

C. 大规模串行结构和信息的串行处理

D. 通过输入多个非线性模型以及不同模型之间的加权互联

答案: 请关注公众号【广开搜题】查看答案

问题 19: 13. 如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( )

选项:

A. 应用部署

B. 模型构建与评估

C. 明确数据挖掘目标

D. 数据收集与清洗

答案: 请关注公众号【广开搜题】查看答案

问题 20: 14. 下列选项中,不是对支持向量机的描述的是?( )

选项:

A. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面

B. 以结构风险最小为原则

C. 训练数据较大

D. 基于小概率事件原理

答案: 请关注公众号【广开搜题】查看答案

问题 21: 15. 采用假设检验的方法观测事件并下结论(在一定的显著性水平下得出的)时,有可能会给出错误判断。下列描述不正确的是?( )

选项:

A. 当原假设为真时,却否定它而犯的错误,即拒绝正确假设的错误,也叫弃真错误,通常也叫α错误

B. α错误和β错误在其他条件不变的情况下是相反的,即α增大时,β就减小;α减小时,β就增大。α错误容易受数据分析人员的控制

C. 当原假设为假时,却肯定它而犯的错误,即接受错误假设的错误,也叫纳伪错误,通常也叫β错误

D. α错误和β错误在其他条件不变的情况下是一致的,即α增大时,β就增大;α减小时,β就减小。α错误容易受数据分析人员的控制

答案: 请关注公众号【广开搜题】查看答案

问题 22: 16. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述?( )

选项:

A. 数据分析更重视结合业务知识解读统计结果

B. 数据分析需要有过硬的数学功底和编程技术

C. 数据分析更重视模型或规则的构建

D. 数据分析是技术性的“采矿”过程,发现未知的模式和规律

答案: 请关注公众号【广开搜题】查看答案

问题 23: 17. 下列常用的数据分析与挖掘工具中,不属于开源工具的是?( )

选项:

A. SPSS

B. R语言

C. Weka

D. Python

答案: 请关注公众号【广开搜题】查看答案

问题 24: 18. 下列对数据挖掘的描述不正确的选项是?( )

选项:

A. 贝叶斯分类方法(Bayesian Classifier)是非常成熟的统计学分类方法,它主要用来预测类成员间关系的可能性。

B. 神经网络(Neural Network)是通过数学算法来模仿人脑思维的抽象计算模型,它是数据挖掘中机器学习的典型代表。

C. 回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具.

D. 关联规则经过划分后,每个群组内部各对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。

答案: 请关注公众号【广开搜题】查看答案

问题 25: 19. 下列不是对决策树CHAID算法的描述的选项是?( )

选项:

A. 检验标准是基尼系数(Gini)等不纯度的指标

B. 应用的前提是因变量为类别型变量(Category)

C. 利用卡方检验来选择对因变量最有影响的自变量

D. 依据局部最优原则

答案: 请关注公众号【广开搜题】查看答案

问题 26: 20. 有一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别。为了解决这个问题,同学们马上简单的统计了7位同学的相关特征数据。那么请问,要解决老师的问题,采用哪种数据挖掘方法最合适?( )

选项:

A. 聚类分析

B. 假设检验

C. 决策树

D. 神经网络

答案: 请关注公众号【广开搜题】查看答案

问题 27: 21. 数据挖掘流程的操作步骤中,不包括以下哪种?( )

选项:

A. 构建模型

B. 绘制表格

C. 应用部署

D. 模型评估

答案: 请关注公众号【广开搜题】查看答案

问题 28: 22. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?( )

选项:

A. 数据挖掘是技术性的“采矿”过程,发现未知的模式和规律

B. 数据挖掘需要有过硬的数学功底和编程技术

C. 数据挖掘更重视模型或规则的构建

D. 数据挖掘侧重于实际的业务知识

答案: 请关注公众号【广开搜题】查看答案

问题 29: 23. 下列描述中,不属于神经网络的特点的是?( )

选项:

A. 大规模并行结构和信息的并行处理

B. 完美的知识和结果的解释性

C. 良好的自适应性、自组织性和高容错性

D. 较强的学习、记忆和识别功能

答案: 请关注公众号【广开搜题】查看答案

问题 30: 24. 2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )

选项:

A. 决策树

B. 支持向量机

C. 神经网络

D. 假设检验

答案: 请关注公众号【广开搜题】查看答案

问题 31: 25. 从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( )

选项:

A. 数据分析侧重于实际的业务知识

B. 数据分析属于描述和探索性分析,评估现状和修正不足

C. 数据分析需要有过硬的数学功底和编程技术

D. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能

答案: 请关注公众号【广开搜题】查看答案

问题 32: 26. 数据挖掘流程的操作步骤有几种?( )

选项:

A. 构建模型

B. 应用部署

C. 模型评估

D. 数据清洗

答案: 请关注公众号【广开搜题】查看答案

问题 33: 27. 免费的数据分析与挖掘工具有下列哪几种:( )

选项:

A. R语言

B. Weka

C. Python

D. SPSS

答案: 请关注公众号【广开搜题】查看答案

问题 34: 28. 相对于数据分析来说,数据挖掘需要掌握的技能有:( )

选项:

A. 良好的数学功底

B. 基本的统计学知识

C. 优秀的编程能力

D. 常用可视化图表展现的能力

答案: 请关注公众号【广开搜题】查看答案

问题 35: 29. 下列不属于数据挖掘技术的有:( )

选项:

A. PowerBI

B. SQL

C. 假设检验

D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 36: 30. 下面选项中,属于列表的方法的是( )。

选项:

A. PowerBI

B. 假设检验

C. Weka

D. 贝叶斯定理

答案: 请关注公众号【广开搜题】查看答案

问题 37: 31. 属于数据分析与数据挖掘工具的有:( )

选项:

A. R语言

B. Python

C. SQL

D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 38: 32. 下列属于数据挖掘技术的有:( )

选项:

A. 神经网络

B. 决策树

C. 关联规则

D. 回归分析

答案: 请关注公众号【广开搜题】查看答案

问题 39: 33. 下列属于数据挖掘技术的有:( )

选项:

A. 神经网络

B. SPSS

C. 支持向量机

D. 决策树

答案: 请关注公众号【广开搜题】查看答案

问题 40: 34. 下列选项中,属于数据挖掘的成熟技术的是:( )

选项:

A. 神经网络

B. 支持向量机

C. 决策树

D. 聚类方法

答案: 请关注公众号【广开搜题】查看答案

问题 41: 35. 相对于数据分析来说,数据挖掘更加侧重于哪些层面:( )

选项:

A. 实际的业务知识

B. 技术的实现

C. 运用技术手段从海量的数据中发现未知的模式和规律

D. 将数据和业务紧密结合,实现功效的最大化

答案: 请关注公众号【广开搜题】查看答案

问题 42: 36. 下列选项中,不是对支持向量机的描述的是?( )

选项:

A. 以结构风险最小为原则

B. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面

C. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合

D. 训练数据较小

答案: 请关注公众号【广开搜题】查看答案

问题 43: 37. 沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )

选项:

A. 决策树

B. 神经网络

C. 关联规则

D. 聚类分析

答案: 请关注公众号【广开搜题】查看答案

问题 44: 38. 不属于数据分析与数据挖掘工具的有:( )

选项:

A. SPSS

B. Python

C. R语言

D. SQL

答案: 请关注公众号【广开搜题】查看答案

问题 45: 39. 下列关于聚类分析不正确的说法是:( )

选项:

A. 运用层次的方法, 依次让最相似的数据对象两两合并,这样不断地合并,最后就形成了一棵聚类树

B. 按照相似性和相异性进行划分后,每个群组内部各对象间的相似度会很高,而不同群组对象之间的相异度很低

C. 直接作为模型对观察对象进行群体划分

D. 数据处理阶段用作数据探索的工具,通过聚类发现数据间的深层次的关系等

答案: 请关注公众号【广开搜题】查看答案

问题 46: 40. Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )

选项:

A. 1991年

B. 1989年

C. 1996年

D. 1993年

答案: 请关注公众号【广开搜题】查看答案

问题 47: 41. 决策树技术对数据的分布甚至缺失非常宽容,不容易受到极值的影响。( )

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 48: 42. 关联规则数据挖掘的主要目的是找出数据集中同时出现的关系( )

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 49: 43. 目前,最常用的3种决策树算法分别是CHAID、CART和ID3。( )

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 50: 44. 从广义角度来说,数据分析和数据挖掘包含的范畴是一致的。( )

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 51: 45. 神经网络对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合。( )

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 52: 46. 支持度和关联度是衡量关联规则强度的两个重要指标( )

选项:

答案: 请关注公众号【广开搜题】查看答案

电话咨询