百年教育职业培训中心 百年教育学习服务平台
题库试卷

【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包05期末考试押题试卷与答案

来源: 更新时间:

23春大数据技术导论试卷包-05关注公众号【国开搜题】,回复【试题】获取试题答案一、判断题1.通常一个作业的输入都是基于分布式文件系统的文件,而对于一个Map任务而言,它的输入是输入文件的一个数据块,

23春大数据技术导论试卷包-05

关注公众号【国开搜题】,回复【试题】获取试题答案

、判断题

1. 通常一个作业的输入都是基于分布式文件系统的文件,而对于一个 Map任务而言,它的输入是输入文件的一个数据块,或者是数据块的一部分,也可跨越数据块。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 系统抽样又称为等距抽样,当总体中个体数少,且其分布没有明显的不均匀情况时,常采用系统抽样。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 数值约简是利用替代的方式,使用较小的数据表示替换或估计数据,进而可以减少数据量。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 批量计算是一种在线计算,支持海量作业 并发规模,系统自动完成资源管理、作业调度和数据加载,并按实际使用量计费。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 为了更有效地处理数据,应该尽可能地限制静态数据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 气泡图是柱状图的一种变体,通过每个点的面积大小来反映第三维。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 由大及小的可视化展现方式是:先给出一个整体的画面,可以引导阅读者具体深入到一个聚焦的点。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 通用网络爬虫又称为全网爬虫,其可将爬行对象从一些种子 URL扩充到整个 Web,主要为门户站点搜索引擎和大型 Web服务采集数据。()

A.

B. ×渝粤教育

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 在互联网营销中,用户反馈承担的核心任务是为产品收集用户舆情信息。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

10. 探索性数据分析强调灵活探求线索和证据,而证实性数据分析则着重评估现有证据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 一次移动平均法仅适用于没有明显的迅速上升或下降趋势的情况,如果时间数列呈直线上升或下降趋势,则需要使用二次移动平均法。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

12. 准确性、完整性、一致性和及时性称为数据质量的四要素。()

A. 渝粤教育

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、单选题

1. 下列不属于基于时间戳的增量数据抽取方式的优点的是()?

A. 性能优异

B. 系统设计清晰

C. 数据抽取简单

D. 对业务系统无其他要求

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。国开一网一平台

2. 下列不会造成文本记录重复相似的是()?

A. 插入

B. 交换渝粤教育

C. 等价表述

D. 删除冗余

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 下列不属于指数平滑法的适用范围的是()?渝粤题库

A. 稳定变化态势的时间序列数据

B. 不稳定变化的时间序列数据

C. 规则变化的时间序列数据渝粤搜题

D. 直线上升或下降趋势的时间序列数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. Z分数规范化方法依据的是原始数据的()?

A. 均值和中位数

B. 中位数和极差

C. 极差和方差

D. 均值和标准差

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 下列不属于文本数据语义特征的是()?

A. 词频

B. 逻辑结构

C. 动态演化规律渝粤搜题

D. 数据结构

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 文本数据是典型的()?

A. 结构化数据

B. 半结构化数据

C. 非结构化数据

D. 混合结构数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 下面是数据科学的主要研究内容的是()?

A. 数据泄露

B. 数据交易

C. 数据盗窃

D. 数据分析

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 下面不属于流式数据的特点的是()?

A. 实时性

B. 层次性

C. 易失性

D. 突发性

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. MapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。

A. 作业

B. 任务

C. 作业服务器

D. 任务服务器

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. MapReduce以什么方式进行分布式计算()?

A. 文本

B. 函数

C. 数据集

D. 矩阵

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 下列不属于特征约简的步骤的是()?

A. 搜索过程

B. 填补过程

C. 评估过程

D. 分类过程

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 下列不属于信息孤岛带来的问题的是()?

A. 数据不能共享国开一网一平台

B. 冗余数据

C. 数据优化

D. 垃圾数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。国开一网一平台

13. 下列属于意见建议类用户反馈的特点的是()?

A. 反馈量大

B. 反馈速度快国开搜题

C. 针对性强渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

D. 传播快

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

14. 下列属于聚焦网络爬虫的特点的是()?

A. 数量巨大

B. 范围较大

C. 精准筛选

D. 爬行速度慢

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

15. 下列不属于数据分散性特征的是()?

A. 均值

B. 极差

C. 方差

D. 变异系数

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

16. 下列不属于回归分析的类别的是()?

A. 一元回归分析

B. 二元回归分析

C. 多元回归分析

D. 线性回归分析

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、问答题

1. 数据约简的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 地图的构成要素有哪些?请简要说明并解释每种要素的含义。渝粤搜题

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 什么是相关分析?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 分箱平滑法的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 互联网大数据的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 图像数字化的定义?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

7. 请简述MapReduce的计算过程?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

关注公众号【国开搜题】,回复【试题】获取试题答案

电话咨询