百年教育职业培训中心 百年教育学习服务平台
题库试卷

【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包02期末考试押题试卷与答案

来源: 更新时间:

23春大数据技术导论试卷包-02关注公众号【国开搜题】,回复【试题】获取试题答案一、判断题1.MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要

23春大数据技术导论试卷包-02

关注公众号【国开搜题】,回复【试题】获取试题答案

、判断题

1. MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要生成一个输出元素。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

2. 特征约简是在保留、提高原有判别能力的前提下,从原有的特征中删除不重要或不相关的特征,或者通过对特征进行重组来减少特征的个数,同时减少特征向量的维度。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 数据约简是指在对挖掘任务和数据本身内容理解的基础之上,寻找依赖于发现目标特征的有用数据,以缩减数据规模,从而在尽可能保持数据原貌的前提下,最大限度地精简数据量。()国开一网一平台

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. Cyber空间是指以计算机技术、现代通信网络技术、虚拟现实技术等信息技术的综合运用为基础,以知识和信息为内容的新型空间。()

A.

B. ×渝粤教育

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 流式数据的处理是批量处理。()

A. 国开一网一平台渝粤搜题

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 文本数据是典型的结构化数据类型。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 图像信息获取的方法只有扫描技术。()

A. 渝粤教育

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 大数据的获取要避免重复数据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 从分析的结果上来看,大数据分析主要分为探索性数据分析、证实性数据分析、定性数据分析;从分析的方式上来看,大数据分析主要分为离线数据分析、在线数据分析和交互式分析。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 数据转换可将原始数据转换成适合数据分析的形式,如果数据转换处理不当,将严重扭曲数据本身的内涵,改变数据原本的形态。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 数据清洗是数据预处理的重要部分,其主要工作是检查数据的完整性及数据的一致性, 对其中的噪声数据进行平滑,对丢失的数据进行填补,以及对重复的数据进行消除等。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、单选题

1. 下列不属于文本相似度计算流程的是()?

A. 文本排序

B. 文本分词渝粤教育

C. 统计词频

D. 写出词频向量渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 数据清洗算法的衡量标准主要包含 )、错误返回率和精确度。

A. 冗余度

B. 返回率

C. 可用性

D. 一致性

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 下列不属于指数平滑法的适用范围的是()?

A. 稳定变化态势的时间序列数据

B. 不稳定变化的时间序列数据

C. 规则变化的时间序列数据

D. 直线上升或下降趋势的时间序列数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. Z分数规范化方法中,下列可以替换标准差的是()?渝粤题库

A. 均值

B. 方差

C. 极差

D. 平均值绝对偏差

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 下列不属于地图的构成要素的是()?

A. 图形要素

B. 价格要素

C. 数学要素

D. 辅助要素

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 基于任务的定义和分类,下列不属于可视分析关注点的是()?

A. 以用户价值为关注点

B. 以用户意图为关注点

C. 以同户行为为关注点

D. 以软件操作为关注点

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 下面不属于互联网大数据的是()?

A. 视频

B. 图片

C. 音频

D. 心情

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 下面不是研究数据方法的是()?渝粤搜题

A. 统计学

B. 机器学习

C. 心理分析

D. 数据挖掘

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 下列不属于单词计数的Map过程的是()?

A. 按列分割文件

B. 分词处理

C. 按行分割文件

D. 排序与合并

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. Hadoop作业服务器不负责()?

A. 接受用户提交的作业渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

B. 任务的分配

C. 执行具体的任务

D. 管理所有的任务服务器

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 下列不属于无参数值约简技术的是()?

A. 直方图

B. 聚类

C. 选择

D. 线性回归模型

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 下列不属于数据约简的特点()?

A. 计算量巨大

B. 成本降低

C. 较少存储量渝粤搜题

D. 方便分类

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

13. 下列不属于NoSQL数据库的键值式存储的常见形式的是()?

A. 临时型

B. 附加型国开搜题

C. 混合型

D. 永久型

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

14. 下列不属于通用网络爬虫的结构的是()?

A. 页面爬行模块

B. 页面分析模块

C. 页面数据库

D. 页面修改模块

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。国开一网一平台

15. 下列不属于判别方法的是()?

A. 最大似然法

B. 最小二乘法

C. 距离判别法

D. 贝叶斯判别法

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

16. 下列不属于相关系数的是()?

A. 简单相关系数

B. 复相关系数

C. 典型相关系数

D. 常态相关系数

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、问答题

1. 什么是数值约简?数值约简技术可以分为哪两类?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

2. 根据信息的特征,可以将信息可视化划分为哪些类别?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 数据分析与数据挖掘的主要区别是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 移动平均法的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 数据科学的定义?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 大数据获取的定义?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 请简述MapReduce的基本原理。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

关注公众号【国开搜题】,回复【试题】获取试题答案

电话咨询