百年教育职业培训中心 百年教育学习服务平台
题库试卷

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)形成型考核五_1参考答案

来源: 更新时间:

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)形成型考核五_1参考答案试卷总分:100得分:1001.下列关于聚类分析不正确的说法是:()A.直接作为模型对观察对象进行群体划分B.数据处理阶

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)形成型考核五_1参考答案


试卷总分:100 得分:100

1.下列关于聚类分析不正确的说法是:( )

A.直接作为模型对观察对象进行群体划分

B.数据处理阶段用作数据探索的工具,通过聚类发现数据间的深层次的关系等

C.按照相似性和相异性进行划分后,每个群组内部各对象间的相似度会很高,而不同群组对象之间的相异度很低

D.运用层次的方法, 依次让最相似的数据对象两两合并,这样不断地合并,最后就形成了一棵聚类树

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


2.从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述?( )

A.数据分析是技术性的“采矿”过程,发现未知的模式和规律

B.数据分析需要有过硬的数学功底和编程技术

C.数据分析更重视结合业务知识解读统计结果

D.数据分析更重视模型或规则的构建

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


3.下列选项中,不是对支持向量机的描述的是?( )

A.以结构风险最小为原则

B.训练数据较大

C.在线性的情况下,就在原空间寻找两类样本的最优分类超平面

D.基于小概率事件原理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


4.下列描述中,不属于神经网络的特点的是?( )

A.完美的知识和结果的解释性

B.大规模并行结构和信息的并行处理

C.较强的学习、记忆和识别功能

D.良好的自适应性、自组织性和高容错性

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案渝粤题库


5.下列常用的数据分析与挖掘工具中,不属于开源工具的是?( )

A.Weka

B.Python

C.R语言

D.SPSS

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


6.沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )

A.神经网络

B.决策树

C.聚类分析

D.关联规则

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


7.构建模型前的数据准备时间在整个数据挖掘流程中的时间占比是多少?( )

A.0.6

B.0.5

C.0.8

D.0.2

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


8.有一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别。为了解决这个问题,同学们马上简单的统计了7位同学的相关特征数据。那么请问,要解决老师的问题,采用哪种数据挖掘方法最合适?( )

A.假设检验

B.决策树

C.聚类分析

D.神经网络

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广开形成性考核答案


9.2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )

A.神经网络

B.支持向量机

C.决策树

D.假设检验

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


10.不属于Python语言代码特点的是:( )

A.易维护性

B.易读性

C.简洁性

D.不可移植性

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


11.下列不是对决策树CHAID算法的描述的选项是?( )

A.利用卡方检验来选择对因变量最有影响的自变量

B.依据局部最优原则

C.应用的前提是因变量为类别型变量(Category)

D.检验标准是基尼系数(Gini)等不纯度的指标

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


12.在回归分析中,下列哪个选项不属于线性回归( )

A.多元线性回归

B.分段回归

C.一元线性回归

D.多个因变量与多个自变量的回归

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


13.下列对数据挖掘的描述不正确的选项是?( )

A.关联规则经过划分后,每个群组内部各对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。广东开放大学作业答案

B.回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具.

C.神经网络(Neural Network)是通过数学算法来模仿人脑思维的抽象计算模型,它是数据挖掘中机器学习的典型代表。

D.贝叶斯分类方法(Bayesian Classifier)是非常成熟的统计学分类方法,它主要用来预测类成员间关系的可能性。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


14.下列关于贝叶斯定理描述错误的是:( )

A.主要用来确定群组内部和群租间的相似度和相异度

B.主要用于分类问题的归类等

C.朴素贝叶斯分类方法可以跟决策树和神经网络算法相媲美。

D.一种非常成熟的统计学分类方法

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


15.下列常用的数据分析与挖掘工具中,属于商业软件的是?( )

A.Weka

B.Python

C.SPSS

D.R语言

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


16.对于假设检验,下列说法正确的是:( )

A.知识和结果的不可解释性

B.以结构风险最小为原则

C.主要用于分类问题的归类等

D.基于小概率事件原理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


17.采用假设检验的方法观测事件并下结论(在一定的显著性水平下得出的)时,有可能会给出错误判断。下列描述不正确的是?( )

A.当原假设为真时,却否定它而犯的错误,即拒绝正确假设的错误,也叫弃真错误,通常也叫α错误

B.α错误和β错误在其他条件不变的情况下是一致的,即α增大时,β就增大;α减小时,β就减小。α错误容易受数据分析人员的控制

C.α错误和β错误在其他条件不变的情况下是相反的,即α增大时,β就减小;α减小时,β就增大。α错误容易受数据分析人员的控制

D.当原假设为假时,却肯定它而犯的错误,即接受错误假设的错误,也叫纳伪错误,通常也叫β错误广开形成性考核答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


18.不属于数据分析与数据挖掘工具的有:( )

A.R语言

B.SQL

C.SPSS

D.Python

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


19.数据挖掘流程的操作步骤中,不包括以下哪种?( )

A.应用部署

B.绘制表格

C.模型评估

D.构建模型广东开放大学作业答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


20.从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?( )

A.数据挖掘是技术性的“采矿”过程,发现未知的模式和规律

B.数据挖掘更重视模型或规则的构建

C.数据挖掘侧重于实际的业务知识广东开放大学作业答案

D.数据挖掘需要有过硬的数学功底和编程技术

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


21.从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( )

A.数据分析侧重于实际的业务知识

B.优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能

C.数据分析属于描述和探索性分析,评估现状和修正不足

D.数据分析需要有过硬的数学功底和编程技术

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


22.关于支持向量机,下列说法正确的选项是?( )

A.大规模串行结构和信息的串行处理

B.知识和结果的不可解释性

C.对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合

D.通过输入多个非线性模型以及不同模型之间的加权互联

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤题库

23.Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )

A.1996年

B.1991年

C.1989年

D.1993年

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


24.下列对决策树ID3算法的描述不正确的选项是?( )

A.根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性

B.样本集的划分依据测试属性的取值进行

C.基于信息熵来选择最佳测试属性

D.利用卡方检验来选择对因变量最有影响的自变量

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


25.2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )

A.决策树广东开放大学作业答案

B.回归分析

C.假设检验

D.神经网络

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


26.免费的数据分析与挖掘工具有下列哪几种:( )

A.Weka

B.R语言

C.SPSS

D.Python

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


27.下列不属于数据挖掘技术的有:( )

A.Weka

B.PowerBI

C.SQL

D.假设检验

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


28.下列属于数据挖掘技术的有:( )

A.关联规则

B.神经网络广东开放大学作业答案

C.决策树

D.回归分析

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


29.相对于数据分析来说,数据挖掘需要掌握的技能有:( )

A.基本的统计学知识

B.良好的数学功底

C.常用可视化图表展现的能力

D.优秀的编程能力

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


30.下列选项中,属于数据挖掘的成熟技术的是:( )

A.支持向量机

B.神经网络

C.聚类方法

D.决策树

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


31.属于数据分析与数据挖掘工具的有:( )

A.SQL

B.Weka

C.R语言

D.Python

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


32.下面选项中,属于列表的方法的是( )。

A.假设检验

B.贝叶斯定理广开形成性考核答案

C.Weka

D.PowerBI

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


33.下列属于数据挖掘技术的有:( )

A.支持向量机

B.决策树渝粤搜题

C.SPSS

D.神经网络

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

广东开放大学作业答案

34.数据挖掘流程的操作步骤有几种?( )

A.构建模型

B.应用部署

C.模型评估

D.数据清洗

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


35.相对于数据分析来说,数据挖掘更加侧重于哪些层面:( )

A.运用技术手段从海量的数据中发现未知的模式和规律

B.将数据和业务紧密结合,实现功效的最大化

C.技术的实现

D.实际的业务知识

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


36.关于神经网络,描述错误的选项是?( )

A.“神经网络是通过输入多个非线性模型以及不同模型之间的加权互联

B.主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习

C.知识和结果的不可解释性

D.大规模串行结构和信息的串行处理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


37.通常情况下,神经网络不会应用在下列哪个领域?( )

A.信号处理渝粤题库

B.统计分析

C.模式识别

D.预测系统

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


38.相对于数据挖掘来说,数据分析呈现的结果更多偏向于:( )广开形成性考核答案

A.统计描述结果的呈现

B.通过模型或规则实现智能的商业决策,划分产品所属的群类

C.模型或规则的输出

D.通过模型或规则可对未知标签的数据进行预测判别用户是否响应某种营销活动

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


39.下列不是对决策树CHAID算法的描述的选项是?( )

A.ID3

B.CHAID

C.SQL)

D.CART

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


40.下列选项中,不是对支持向量机的描述的是?( )

A.以结构风险最小为原则

B.对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合

C.训练数据较小

D.在线性的情况下,就在原空间寻找两类样本的最优分类超平面

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


41.沃尔玛超市中“啤酒和尿不湿”的营销案例是关联规则运用的经典案例( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


42.关联规则数据挖掘的主要目的是找出数据集中同时出现的关系( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


43.支持向量机的优点是容易过拟合( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


44.决策树技术对数据的分布甚至缺失非常宽容,不容易受到极值的影响。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


45.回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


46.相对于数据分析来说,数据挖掘更加侧重于将数据和业务紧密结合,实现功效的最大化。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤教育

47.神经网络对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


48.支持向量机是以结构风险最小为原则( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


49.线性回归包括一元非线性回归、多元非线性回归和分段回归( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


50.相对于数据分析来说,数据挖掘更需要有优秀的编程能力。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


电话咨询