百年教育职业培训中心 百年教育学习服务平台
题库试卷

【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包04期末考试押题试卷与答案

来源: 更新时间:

23春大数据技术导论试卷包-04关注公众号【国开搜题】,回复【试题】获取试题答案一、判断题1.MapReduce的基本原理就是将大数据分成小块逐个分析,最后将提取出来的数据汇总分析,进而获得需要的结果

23春大数据技术导论试卷包-04

关注公众号【国开搜题】,回复【试题】获取试题答案

、判断题

1. MapReduce的基本原理就是将大数据分成小块逐个分析,最后将提取出来的数据汇总分析,进而获得需要的结果。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 对于高维数据,通过降维的维数约简方法可以减少冗余数据。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 持久化数据的安全通过不同层次的管理来实现,即物理层、网络层和数据存储层。()

A.

B. ×国开搜题

答案:B
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. Cyber空间是指以计算机技术、现代通信网络技术、虚拟现实技术等信息技术的综合运用为基础,以知识和信息为内容的新型空间。()

A.

B. ×

答案:A
- 关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 计算机科学是算法与算法变换的科学。()

A.

B. ×国开搜题

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 由大及小的可视化展现方式是:先给出一个整体的画面,可以引导阅读者具体深入到一个聚焦的点。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 数学要素用来确定地学要素的空间相关位置,是地图内容骨架的要素。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 空间数据是一种用点、线、面以及实体等基本空间数据结构来表示自然世界的数据。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 网络爬虫可以分为通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫等。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 数据挖掘是大数据分析的核心,其通过建模和构造算法来获取信息与知识。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 移动平均法分为一次移动平均法、混合移动平均法和多次移动平均法。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. k-NN近邻缺失数据填充算法是一种简单快速的算法,它利用本身具有完整记录的属性值实现对缺失属性值的估计。()

A.

B. ×

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、单选题

1. 下列不属于数据质量一致性的是()?渝粤搜题

A. 数据编码一致性

B. 数据大小一致性

C. 指标统计一致性

D. 指标计算一致性

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 下列不属于数据质量的要素的是()?

A. 准确性

B. 完整性

C. 异质性

D. 及时性

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 如果x的平均值和标准差分别为 54000 16000。使用z分数规范化方法,x的值 73600被转换为()?

A. 1.125

B. 1.025渝粤教育

C. 1.225

D. 1.325

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 下列属于二次移动平均法的适用范围的是()?

A. 水平变动的时间序列数据

B. 长期变动趋势的时间序列数据

C. 循环性变动的时间序列数据

D. 直线上升或下降趋势的时间序列数据渝粤教育

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 基于任务的定义和分类,下列不属于可视分析关注点的是()?渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

A. 以用户价值为关注点

B. 以用户意图为关注点

C. 以同户行为为关注点渝粤题库

D. 以软件操作为关注点

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 下列不属于信息可视化的分类的是()?

A. 一维信息可视化

B. 三维信息可视化

C. 截面数据可视化

D. 时序信息可视化

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 下面不属于互联网大数据的是()?

A. 视频

B. 图片国开搜题

C. 音频

D. 心情

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

8. 下面不属于流式数据源的是()?

A. 硬盘数据

B. 传感器数据

C. 实时图像数据

D. 流媒体传输

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

9. 下列不属于Map任务的执行的子步骤的是()?

A. 输入准备

B. 输入修改渝粤题库

C. 算法执行

D. 输出生成

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

10. 下列不属于一个作业的计算流程的是()?

A. 作业开始

B. 作业修改渝粤教育

C. Map任务分配

D. Reduce任务执行

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

11. 下列不属于数据约简中有无监督信息分类的是()?

A. 监督式维数约简

B. 半监督式维数约简

C. 非监督式维数约简

D. 混合式维数约简

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

12. 下列不属于无参数值约简技术的是()?

A. 直方图渝粤题库

B. 聚类

C. 选择

D. 线性回归模型

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

13. 下列属于意见建议类用户反馈的特点的是()?

A. 反馈量大

B. 反馈速度快

C. 针对性强

D. 传播快

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

14. 下列不属于数据库架构混合应用模式的是()?

A. OldSQLNewSQL混合模式渝粤教育

B. OldSQLNoSQL+ NewSQL混合模式

C. OldSQLNoSQL混合模式

D. NewSQLNoSQL混合模式

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

15. 下列不属于回归分析的类别的是()?渝粤题库

A. 一元回归分析

B. 二元回归分析

C. 多元回归分析

D. 线性回归分析

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

16. 下列属于数据分析的特点的是()?

A. 数据量大

B. 目标不清晰

C. 处理不同类型的数据

D. 结果不易解释

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

、问答题

1. 请简述数据集成的概念。渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

2. 可视化的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

3. 大数据分析的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

4. 分箱平滑法的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

5. 互联网大数据的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

6. 传统数据获取与大数据获取的区别?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

7. 同构异质数据库的定义是?

答案:关注公众号【国开搜题】,对话框内发送试题,获得答案。

关注公众号【国开搜题】,回复【试题】获取试题答案

渝粤题库

电话咨询