百年教育职业培训中心 百年教育学习服务平台
国开搜题

2024秋最新国家开放大学国开电大机考期末2春大数据技术导论试卷包机考期末试卷参考试题

来源: 更新时间:

23春大数据技术导论试卷包-01关注公众号【飞鸟搜题】,回复【试题】获取试卷答案文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着

23春大数据技术导论试卷包-01

关注公众号【飞鸟搜题】,回复【试题】获取试卷答案

文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。

课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究


一 、判断题

1. MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要生成一个输出元素。()

A.

B. ×

答案:A
- 关注公众号【飞鸟搜题】查看答案

2. 维数约简又称为降维,对于较高维空间的数据库X,通过特征提取或者特征选择的方法,将原空间的维数降至m维。()

A.

B. ×

答案:A
- 关注公众号【飞鸟搜题】查看答案

3. 确定样本子集大小的因素中不包括计算成本和存储要求。()

A.

B. ×

答案:B
- 关注公众号【飞鸟搜题】查看答案

4. 静态数据是流式数据。()

A.

B. ×

答案:B
- 关注公众号【飞鸟搜题】查看答案

5. 实时计算系统的设计需要考虑高延迟、高性能、分布式、可扩展、高容错。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

6. 检验假设是数理统计学中根据一定假设条件由样本推断总体的一种方法,先对总体的特征进行某种假设,然后通过抽样研究的统计推理,决定拒绝这个假设还是接受这个假设。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

7. 可视化可以使用计算机支持的、交互的方式来表示抽象数据,以增强用户的认知能力,其侧重于通过可视化文本展现数据中隐含的信息和规律,建立符合人的认知规律的心理映像。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

8. 大数据的获取要避免重复数据。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

9. 图形数字化是将图形的连续模拟量转换成离散的数字量的过程。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

10. 探索性数据分析强调灵活探求线索和证据,而证实性数据分析则着重评估现有证据。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

11. 数据转换可将原始数据转换成适合数据分析的形式,如果数据转换处理不当,将严重扭曲数据本身的内涵,改变数据原本的形态。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

12. 数据清洗的标准只包含返回率和精确度两个方面。()

A.

B. ×

答案:关注公众号【飞鸟搜题】查看答案

二 、单选题

1. 下列不属于大数据抽取方式的是()?

A. 同构同质数据抽取

B. 异构同质数据抽取

C. 同构异质数据抽取

D. 文件型数据抽取

答案:关注公众号【飞鸟搜题】查看答案

2. 下列不属于数据清洗算法标准的是()?

A. 返回率

B. 错误返回率

C. 正确返回率

D. 精确度

答案:关注公众号【飞鸟搜题】查看答案

3. Z分数规范化方法依据的是原始数据的()?

A. 均值和中位数

B. 中位数和极差

C. 极差和方差

D. 均值和标准差

答案:关注公众号【飞鸟搜题】查看答案

4. 如果x的平均值和标准差分别为 54000和 16000。使用z分数规范化方法,x的值 73600被转换为()?

A. 1.125

B. 1.025

C. 1.225

D. 1.325

答案:关注公众号【飞鸟搜题】查看答案

5. 下列不属于信息可视化的分类的是()?

A. 一维信息可视化

B. 三维信息可视化

C. 截面数据可视化

D. 时序信息可视化

答案:关注公众号【飞鸟搜题】查看答案

6. 下列不属于文本数据语义特征的是()?

A. 词频

B. 逻辑结构

C. 动态演化规律

D. 数据结构

答案:关注公众号【飞鸟搜题】查看答案

7. 下面不属于互联网大数据的是()?

A. 视频

B. 图片

C. 音频

D. 心情

答案:关注公众号【飞鸟搜题】查看答案

8. 下面不属于大数据的特性是()?

A. 数据量大

B. 多样性

C. 真实性差

D. 具有价值

答案:关注公众号【飞鸟搜题】查看答案

9. 下列不属于单词计数的Map过程的是()?

A. 按列分割文件

B. 分词处理

C. 按行分割文件

D. 排序与合并

答案:关注公众号【飞鸟搜题】查看答案

10. 下列不属于一个作业的计算流程的是()?

A. 作业开始

B. 作业修改

C. Map任务分配

D. Reduce任务执行

答案:关注公众号【飞鸟搜题】查看答案

11. 维数灾难通常是指在涉及()计算的问题中,随着维数的增加,计算量呈指数倍增长的 一种现象。

A. 数字

B. 文本

C. 向量

D. 矩阵

答案:关注公众号【飞鸟搜题】查看答案

12. 下列属于随机抽样的特点的是()?

A. 成本低

B. 等可能性

C. 时间短

D. 误差小

答案:关注公众号【飞鸟搜题】查看答案

13. 下列不属于NoSQL数据库的存储方式的是()?

A. 行式存储

B. 键值式存储

C. 图形式存储

D. 文档式存储

答案:关注公众号【飞鸟搜题】查看答案

14. 下列不属于大数据获取的特点的是()?

A. 数据源多种多样

B. 数据量巨大

C. 结构单一

D. 结构化、半结构化和非结构化数据

答案:关注公众号【飞鸟搜题】查看答案

15. 统计的基础是()?

A. 统计工作

B. 计算数据

C. 统计数据

D. 统计科学

答案:关注公众号【飞鸟搜题】查看答案

16. 下列不属于判别方法的是()?

A. 最大似然法

B. 最小二乘法

C. 距离判别法

D. 贝叶斯判别法

答案:关注公众号【飞鸟搜题】查看答案

三 、问答题

1. 数据约简的定义是?

答案:关注公众号【飞鸟搜题】查看答案

2. 请简述检验假设的方法。

答案:关注公众号【飞鸟搜题】查看答案

3. 什么是模型?模型由哪三个部分组成?

答案:关注公众号【飞鸟搜题】查看答案

4. z分数规范化方法的步骤是?

答案:关注公众号【飞鸟搜题】查看答案

5. 大数据的处理过程是?

答案:关注公众号【飞鸟搜题】查看答案

6. NewSQL系统的主要架构?

答案:关注公众号【飞鸟搜题】查看答案

7. 增量数据抽取的特点是?

答案:关注公众号【飞鸟搜题】查看答案

关注公众号【飞鸟搜题】,回复【试题】获取试卷答案

电话咨询