百年教育职业培训中心 百年教育学习服务平台
国开搜题

23春大数据技术导论试卷包-03

来源: 更新时间:

23春大数据技术导论试卷包-03 23春大数据技术导论试卷包-03 关注公众号【飞鸟搜题】,回复【试题】获取试卷答案 文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非...

23春大数据技术导论试卷包-03

23春大数据技术导论试卷包-03

关注公众号【飞鸟搜题】,回复【试题】获取试卷答案

文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。

课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究

本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究

一 、判断题

1. MapReduce模型适用场景的特点是任务可被分解成相互联系的子问题。()

×

答案:B- 关注公众号【飞鸟搜题】查看答案

2. 数据集成是应用、存储以及各组织之间传送的数据管理实践活动,其主要考虑合并规整数据问题。()

×

答案:A- 关注公众号【飞鸟搜题】查看答案

3. 维数约简又称为降维,对于较高维空间的数据库X,通过特征提取或者特征选择的方法,将原空间的维数降至m维。()

×

答案:A- 关注公众号【飞鸟搜题】查看答案

4. 实时计算系统的设计需要考虑高延迟、高性能、分布式、可扩展、高容错。()

×

答案:B- 关注公众号【飞鸟搜题】查看答案

5. 数据能够记录人类的行为,包括工作、生活和社会的发展。()

×

答案:关注公众号【飞鸟搜题】查看答案

6. 检验假设是数理统计学中根据一定假设条件由样本推断总体的一种方法,先对总体的特征进行某种假设,然后通过抽样研究的统计推理,决定拒绝这个假设还是接受这个假设。()

×

答案:关注公众号【飞鸟搜题】查看答案

7. 由于数据随着时间而变化,可以将数据变化可视化,然后解释导致数据变化的原因。()

×

答案:关注公众号【飞鸟搜题】查看答案

8. 获取的数据是指已被转换为电信号的各种物理量,如温度、水位、风速、压力等。()

×

答案:关注公众号【飞鸟搜题】查看答案

9. OldSQL数据库适用于数据分析应用,NewSQL数据库适用于事务处理应用,NoSQL数据库适用于互联网应用。()

×

答案:关注公众号【飞鸟搜题】查看答案

10. 数据分析的分析目标比较明确,分析条件也比较清楚,基本上就是采用统计方法对数据进行多维度的描述,其从一个假设出发,需要自行选择方程或模型来与假设匹配。而数据挖掘不需要假设,其目标不是很清晰,可以自动建立方程与模型。()

×

答案:关注公众号【飞鸟搜题】查看答案

11. 平方根转换适用于等比数据。()

×

答案:关注公众号【飞鸟搜题】查看答案

12. 数据清洗的目的是消除脏数据,主要消除异常数据、清除重复数据、保证数据的完整性等,进而提高数据的可利用性。()

×

答案:关注公众号【飞鸟搜题】查看答案

二 、单选题

1. 下列不属于MD5(消息摘要算法)的特点的()?

对源系统的倾入性较小

被动地进行全表数据的比对

性能优异

准确性不稳定

答案:关注公众号【飞鸟搜题】查看答案

2. 下列不属于文本相似度计算流程的是()?

文本排序

文本分词

统计词频

写出词频向量

答案:关注公众号【飞鸟搜题】查看答案

3. 噪声是指测量数据中的()?

随机误差

均值

方差

极差

答案:关注公众号【飞鸟搜题】查看答案

4. 数据规范化是将原来的度量值转换为()?

无量纲的值

原来度量值的均值

原来度量值的方差

原来度量值的极差

答案:关注公众号【飞鸟搜题】查看答案

5. 下列不属于文本数据语义特征的是()?

词频

逻辑结构

动态演化规律

数据结构

答案:关注公众号【飞鸟搜题】查看答案

6. 可视分析是一种()?

交互式用户界面模型

结构化用户界面模型

非结构化用户界面模型

独立式用户界面模型

答案:关注公众号【飞鸟搜题】查看答案

7. 下面不是数据产品开发的特征的是()?

多样性

无竞争性

增值性

层次性

答案:关注公众号【飞鸟搜题】查看答案

8. 下面不属于数据流技术应用的方式是()?

指定查询

离线计算

即席计算

中间计算

答案:关注公众号【飞鸟搜题】查看答案

9. 下列不属于MapReduce模型的限制因素的是()?

任务要求

数据不可无限分割

通信开销

集群规模

答案:关注公众号【飞鸟搜题】查看答案

10. MapReduce以什么方式进行分布式计算()?

文本

函数

数据集

矩阵

答案:关注公众号【飞鸟搜题】查看答案

11. 下列不属于数据约简中有无监督信息分类的是()?

监督式维数约简

半监督式维数约简

非监督式维数约简

混合式维数约简

答案:关注公众号【飞鸟搜题】查看答案

12. 下列属于随机抽样的特点的是()?

成本低

等可能性

时间短

误差小

答案:关注公众号【飞鸟搜题】查看答案

13. 下列不属于网站数据采集的数据的是()?

非结构化数据

半结构化数据

结构化数据

实验测试数据

答案:关注公众号【飞鸟搜题】查看答案

14. 下列不属于文本数据的获取特点的是()?

灵活度高

速度快

按需获取

易处理

答案:关注公众号【飞鸟搜题】查看答案

15. 下列不属于相关系数的是()?

简单相关系数

复相关系数

典型相关系数

常态相关系数

答案:关注公众号【飞鸟搜题】查看答案

16. 下列不属于回归分析的类别的是()?

一元回归分析

二元回归分析

多元回归分析

线性回归分析

答案:关注公众号【飞鸟搜题】查看答案

三 、问答题

1. 请简述随机抽样方法的特点和实现过程。

答案:关注公众号【飞鸟搜题】查看答案

2. 根据信息的特征,可以将信息可视化划分为哪些类别?

答案:关注公众号【飞鸟搜题】查看答案

3. 请简述回归分析的步骤。

答案:关注公众号【飞鸟搜题】查看答案

4. 分箱平滑法的定义是?

答案:关注公众号【飞鸟搜题】查看答案

5. 数据加工的定义?

答案:关注公众号【飞鸟搜题】查看答案

6. 通用网络爬虫的局限性?

答案:关注公众号【飞鸟搜题】查看答案

7. 常用的大数据的抽取方法有哪些?

答案:关注公众号【飞鸟搜题】查看答案

关注公众号【飞鸟搜题】,回复【试题】获取试卷答案

电话咨询