百年教育职业培训中心 百年教育学习服务平台
题库试卷

【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包01期末考试押题试卷与答案

来源: 更新时间:

23春大数据技术导论试卷包-01关注公众号【国开搜题】,回复【试题】获取试题答案国开一网一平台一、判断题1.MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一

23春大数据技术导论试卷包-01

关注公众号【国开搜题】,回复【试题】获取试题答案

国开一网一平台

、判断题

1. MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要生成一个输出元素。()国开一网一平台

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 维数约简又称为降维,对于较高维空间的数据库X,通过特征提取或者特征选择的方法,将原空间的维数降至m维。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

3. 确定样本子集大小的因素中不包括计算成本和存储要求。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 静态数据是流式数据。()

A.

B. ×

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

5. 实时计算系统的设计需要考虑高延迟、高性能、分布式、可扩展、高容错。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 检验假设是数理统计学中根据一定假设条件由样本推断总体的一种方法,先对总体的特征进行某种假设,然后通过抽样研究的统计推理,决定拒绝这个假设还是接受这个假设。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 可视化可以使用计算机支持的、交互的方式来表示抽象数据,以增强用户的认知能力,其侧重于通过可视化文本展现数据中隐含的信息和规律,建立符合人的认知规律的心理映像。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 大数据的获取要避免重复数据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 图形数字化是将图形的连续模拟量转换成离散的数字量的过程。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 探索性数据分析强调灵活探求线索和证据,而证实性数据分析则着重评估现有证据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 数据转换可将原始数据转换成适合数据分析的形式,如果数据转换处理不当,将严重扭曲数据本身的内涵,改变数据原本的形态。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 数据清洗的标准只包含返回率和精确度两个方面。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、单选题

1. 下列不属于大数据抽取方式的是()?

A. 同构同质数据抽取

B. 异构同质数据抽取渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

C. 同构异质数据抽取

D. 文件型数据抽取

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 下列不属于数据清洗算法标准的是()?

A. 返回率渝粤搜题

B. 错误返回率

C. 正确返回率

D. 精确度

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. Z分数规范化方法依据的是原始数据的()?

A. 均值和中位数

B. 中位数和极差渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

C. 极差和方差国开搜题

D. 均值和标准差

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 如果x的平均值和标准差分别为 54000 16000。使用z分数规范化方法,x的值 73600被转换为()?

A. 1.125

B. 1.025

C. 1.225

D. 1.325

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 下列不属于信息可视化的分类的是()?

A. 一维信息可视化

B. 三维信息可视化

C. 截面数据可视化

D. 时序信息可视化

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 下列不属于文本数据语义特征的是()?

A. 词频

B. 逻辑结构

C. 动态演化规律

D. 数据结构

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 下面不属于互联网大数据的是()?

A. 视频

B. 图片

C. 音频渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

D. 心情

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 下面不属于大数据的特性是()?渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

A. 数据量大渝粤教育

B. 多样性渝粤教育

C. 真实性差

D. 具有价值

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 下列不属于单词计数的Map过程的是()?

A. 按列分割文件

B. 分词处理

C. 按行分割文件

D. 排序与合并

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 下列不属于一个作业的计算流程的是()?

A. 作业开始

B. 作业修改

C. Map任务分配

D. Reduce任务执行

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 维数灾难通常是指在涉及()计算的问题中,随着维数的增加,计算量呈指数倍增长的 一种现象。

A. 数字

B. 文本

C. 向量

D. 矩阵

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 下列属于随机抽样的特点的是()?

A. 成本低

B. 等可能性

C. 时间短

D. 误差小

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

13. 下列不属于NoSQL数据库的存储方式的是()?

A. 行式存储

B. 键值式存储

C. 图形式存储

D. 文档式存储

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

14. 下列不属于大数据获取的特点的是()?

A. 数据源多种多样

B. 数据量巨大

C. 结构单一

D. 结构化、半结构化和非结构化数据

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

15. 统计的基础是()?

A. 统计工作

B. 计算数据

C. 统计数据

D. 统计科学

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

16. 下列不属于判别方法的是()?

A. 最大似然法

B. 最小二乘法

C. 距离判别法国开一网一平台

D. 贝叶斯判别法

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。国开一网一平台

、问答题

1. 数据约简的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 请简述检验假设的方法。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。渝粤题库

3. 什么是模型?模型由哪三个部分组成?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. z分数规范化方法的步骤是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 大数据的处理过程是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. NewSQL系统的主要架构?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 增量数据抽取的特点是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

关注公众号【国开搜题】,回复【试题】获取试题答案

电话咨询