百年教育职业培训中心 百年教育学习服务平台
题库试卷

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目六单元测试_1参考答案

来源: 更新时间:

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目六单元测试_1参考答案试卷总分:100得分:1001.箱型图依据实际数据绘制,对数据没有任何限制性要求。()答案:更多参考答案,请关注【广开

【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目六单元测试_1参考答案


试卷总分:100 得分:100

1.箱型图依据实际数据绘制,对数据没有任何限制性要求。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


2.众数具有唯一性。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


3.Pearson相关只有在变量具有线性关系时才是完全相关的。( )渝粤题库

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


4.一个变量相同的取值必须有相同的秩次。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


5.对于定量变量而言,选择 “组宽”是做频率分布分析时最主要的问题。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


6.平均水平指标使用最广泛的是均值和中位数。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


7.不服从正态分布的变量、分类或等级变量之间的关联性可采用Pearson线性相关系数来描述。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


8.判定系数的取值范围为0≤r2≤1。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


9.corr()用来计算数据样本的协方差矩阵。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


10.插值法就是在记录中找到与缺失样本最接近的样本的该属性值插补。( )

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


11.以下哪项不会导致缺失值的产生?( )

A.有些信息被误删了

B.属性值不存在

C.有些信息暂时无法获取,或者获取信息的代价太大

D.有些信息是被遗漏的

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


12.异常值也称为( )。

A.孤立点

B.界点

C.离群点

D.异常点

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

广开搜题

13.在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过( )倍标准差的值。

A.2倍

B.1倍

C.3倍

D.4倍

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案渝粤搜题


14.对于定性数据,可用( )和条形图直观地显示其分布情况。

A.茎叶图

B.散点图

C.饼图

D.直方图

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


15.对于定量变量而言,选择( )和是做频率分布分析时最主要的问题。

A.“组数”、“组宽”

B.“组数”、“组频率”

C.“组频数”、“组宽”

D.“组频率”、“组频数”

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


16.对比分析是指把两个( )的指标进行比较。

A.规模相当渝粤搜题

B.有差异

C.相互联系

D.结构相同

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


17.将同一现象在不同时期的指标数值进行对比,用以说明发展方向和变化速度,如发展速度、增长速度等是( )。

A.强度相对数

B.比例相对数

C.结构相对数

D.动态相对数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


18.为筹备班级的初中毕业联欢会,班长对全班学生爱吃哪几种水果作了民意调查,决定最终买什么水果,下面的调查数据中最值得关注的是( )

A.中位数

B.加权平均数

C.平均数

D.众数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


19.小明准备参加校运会的跳远比赛,下面是他近期六次跳远的成绩(单位:米):3.6,3.8,4.2,4.0,3.8,4.0,那么这组数据的( )。

A.众数是3.9米

B.中位数是3.8米

C.极差是0.6米

D.平均数是4.0米

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


20.如果一组数据6,x,2,4的平均数是3,那么x是( )。

A.2

B.3

C.0

D.4

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广东开放大学作业答案


21.众数一般用于( )。

A.顺序变量

B.连续型变量

C.类别变量

D.离散型变量广开搜题

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


22.贡献度分析的原理是( )。

A.平马特莱法则

B.帕累托法则

C.四象限法则

D.ABC法则

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


23.判断两个变量是否具有线性相关关系最直观的方法是( )。

A.计算相关系数

B.直接绘制散点图

C.绘制柱状图

D.绘制散点图矩阵

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


24.Pearson相关系数一般用于分析两个( )之间的关系。

A.连续性变量

B.离散性变量

C.定距变量

D.离散系数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


25.在Pearson相关系数的计算公式中,0.3<|r|≤0.5为( )。

A.显著线性相关

B.低度线性相关

C.极弱线性相关

D.高度线性相关

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


26.不服从正态分布的变量、分类或等级变量之间的关联性可采用( )来描述

A.Distance Correlation相关系数

B.Pearson 相关系数

C.Spearman秩相关系数

D.kendall相关系数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


27.以下哪个函数是计算数据样本的协方差矩阵?( )。

A.mean()

B.corr()

C.sum()

D.cov()

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


28.rolling_kurt()的功能是( )。

A.计算数据样本的协方差矩阵

B.样本值的偏度(三阶矩)

C.样本值的峰度(四阶矩)

D.计算数据样本的标准差

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


29.rolling_var()的功能是( )。

A.计算数据样本的标准差

B.计算数据样本的方差

C.计算数据样本的算术平均数

D.计算数据样本的协方差矩阵

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


30.plot()的功能是( )。

A.绘制样本数据的箱型图

B.绘制饼图)

C.绘制二维条形直方图

D.绘制线性二维图,折线图

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

31.某国国内生产总值2009年为2008年的109.01%,这是( )。

A.计划完成相对数

B.比较相对数

C.动态相对数)

D.比例相对数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


32.在记录中找到与缺失样本最接近的样本的该属性值插补,此方法称为( )

A.最近临插补

B.均值/中位数/众数插补

C.使用固定值

D.插值法

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广东开放大学作业答案


33.牛顿插值法与拉格朗日插值相比,具有( )的特点。

A.承袭性和多项性

B.易于变动节点和易于实现性

C.承袭性和易于变动节点

D.承袭性和易于实现性

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


34.将含有异常值的记录直接删除,容易造成( )

A.历史数据减少,影响分析结果的客观性和正确性

B.大量隐藏的记录会被删除,可能会改变变量的原有分布,造成分析结果的不准确

C.资源的大量浪费,影响分析结果的客观性和正确性

D.样本量不足,可能会改变变量的原有分布,造成分析结果的不准确

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


35.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:( )渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

A.有放回的简单随机抽样

B.分层抽样

C.渐进抽样

D.无放回的简单随机抽样广东开放大学作业答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


36.为了消除指标之间的量纲和取值范围差异的影响,需要进行( )。

A.冗余属性识别

B.数据变换

C.实体识别

D.标准化处理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


37.( )是当前用得最多的数据标准化方法。

A.小数定标规范化

B.最小 - 最大规范化

C.零 C 均值规范化

D.标准差标准化

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


38.小波变换具有( )的特点

A.多分辨率

B.多频道

C.可平移

D.可伸缩

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案渝粤题库


39.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:( )

A.0.821

B.0.716

C.1.224

D.1.458

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


40.数据质量分析的主要任务是检查原始数据中是否存在 {图} 。

A.异常值

B.重复值广东开放大学作业答案

C.脏数据

D.无用数据

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


41.脏数据包括()。

A.不一致的值广开搜题

B.异常值

C.缺失值

D.重复数据

E.含有特殊符号(如、¥、*)的数据广东开放大学作业答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


42.分布分析能揭示数据的()。

A.分布类型

B.分布状态

C.分布位置

D.分布特征

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


43.平均水平指标是对个体集中趋势的度量,使用最广泛的是( )。

A.变异系数

B.均值

C.中位数

D.极差

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


44.数据的相关性分析可以( )。

A.各绘制散点图矩阵

B.直接绘制散点图

C.绘制柱状图

D.计算相关系数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤教育

45.pandas 主要统计特征函数有( )。

A.corr()

B.unique()

C.sum()

D.mean()

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


电话咨询