百年教育职业培训中心 百年教育学习服务平台
题库试卷

【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包03期末考试押题试卷与答案

来源: 更新时间:

23春大数据技术导论试卷包-03关注公众号【国开搜题】,回复【试题】获取试题答案一、判断题1.MapReduce模型适用场景的特点是任务可被分解成相互联系的子问题。()A.√B.&time

23春大数据技术导论试卷包-03

关注公众号【国开搜题】,回复【试题】获取试题答案

、判断题

1. MapReduce模型适用场景的特点是任务可被分解成相互联系的子问题。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 数据集成是应用、存储以及各组织之间传送的数据管理实践活动,其主要考虑合并规整数据问题。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 维数约简又称为降维,对于较高维空间的数据库X,通过特征提取或者特征选择的方法,将原空间的维数降至m维。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 实时计算系统的设计需要考虑高延迟、高性能、分布式、可扩展、高容错。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 数据能够记录人类的行为,包括工作、生活和社会的发展。()

A. 国开搜题

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 检验假设是数理统计学中根据一定假设条件由样本推断总体的一种方法,先对总体的特征进行某种假设,然后通过抽样研究的统计推理,决定拒绝这个假设还是接受这个假设。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 由于数据随着时间而变化,可以将数据变化可视化,然后解释导致数据变化的原因。()

A. 渝粤教育

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 获取的数据是指已被转换为电信号的各种物理量,如温度、水位、风速、压力等。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. OldSQL数据库适用于数据分析应用,NewSQL数据库适用于事务处理应用,NoSQL数据库适用于互联网应用。()

A.

B. ×国开搜题

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 数据分析的分析目标比较明确,分析条件也比较清楚,基本上就是采用统计方法对数据进行多维度的描述,其从一个假设出发,需要自行选择方程或模型来与假设匹配。而数据挖掘不需要假设,其目标不是很清晰,可以自动建立方程与模型。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 平方根转换适用于等比数据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

12. 数据清洗的目的是消除脏数据,主要消除异常数据、清除重复数据、保证数据的完整性等,进而提高数据的可利用性。()国开一网一平台

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、单选题

1. 下列不属于MD5(消息摘要算法)的特点的()?

A. 对源系统的倾入性较小

B. 被动地进行全表数据的比对

C. 性能优异

D. 准确性不稳定

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 下列不属于文本相似度计算流程的是()?渝粤题库

A. 文本排序

B. 文本分词国开一网一平台

C. 统计词频

D. 写出词频向量

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 噪声是指测量数据中的()?

A. 随机误差

B. 均值

C. 方差

D. 极差

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 数据规范化是将原来的度量值转换为()?渝粤教育

A. 无量纲的值

B. 原来度量值的均值

C. 原来度量值的方差

D. 原来度量值的极差

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 下列不属于文本数据语义特征的是()?渝粤教育

A. 词频

B. 逻辑结构

C. 动态演化规律

D. 数据结构

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 可视分析是一种()?

A. 交互式用户界面模型渝粤题库

B. 结构化用户界面模型

C. 非结构化用户界面模型

D. 独立式用户界面模型

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 下面不是数据产品开发的特征的是()?

A. 多样性

B. 无竞争性

C. 增值性

D. 层次性

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 下面不属于数据流技术应用的方式是()?

A. 指定查询

B. 离线计算

C. 即席计算

D. 中间计算

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 下列不属于MapReduce模型的限制因素的是()?渝粤教育

A. 任务要求

B. 数据不可无限分割

C. 通信开销

D. 集群规模

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. MapReduce以什么方式进行分布式计算()?

A. 文本

B. 函数

C. 数据集

D. 矩阵

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 下列不属于数据约简中有无监督信息分类的是()?国开搜题

A. 监督式维数约简

B. 半监督式维数约简

C. 非监督式维数约简

D. 混合式维数约简

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 下列属于随机抽样的特点的是()?

A. 成本低

B. 等可能性

C. 时间短

D. 误差小

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

13. 下列不属于网站数据采集的数据的是()?

A. 非结构化数据

B. 半结构化数据

C. 结构化数据渝粤题库

D. 实验测试数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

14. 下列不属于文本数据的获取特点的是()?

A. 灵活度高

B. 速度快

C. 按需获取

D. 易处理

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

15. 下列不属于相关系数的是()?

A. 简单相关系数

B. 复相关系数

C. 典型相关系数

D. 常态相关系数

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

16. 下列不属于回归分析的类别的是()?

A. 一元回归分析

B. 二元回归分析

C. 多元回归分析

D. 线性回归分析

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、问答题

1. 请简述随机抽样方法的特点和实现过程。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 根据信息的特征,可以将信息可视化划分为哪些类别?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 请简述回归分析的步骤。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 分箱平滑法的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 数据加工的定义?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 通用网络爬虫的局限性?渝粤教育

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 常用的大数据的抽取方法有哪些?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

关注公众号【国开搜题】,回复【试题】获取试题答案国开一网一平台

电话咨询