百年教育职业培训中心 百年教育学习服务平台
国家开放大学|国开搜题

超尔星学雅习通Hadoop开发技术作业答案

来源: 更新时间:

Hadoop开发技术学校:无问题1:1.所谓大数据,狭义上可以定义为()选项:•A.用现有的一般技术难以管理的大量数据的集合•B.随着互联网的发展,在我们身边产生的大量数据&bul

Hadoop开发技术

学校: 无

问题 1: 1. 所谓大数据,狭义上可以定义为( )

选项:

A. 用现有的一般技术难以管理的大量数据的集合

B. 随着互联网的发展,在我们身边产生的大量数据

C. 随着硬件和软件技术的发展,数据的存储、处理成本大幅下降,从而促进数据大量产生

D. 随着云计算的兴起而产生的大量数据

答案: 用现有的一般技术难以管理的大量数据的集合

问题 2: 2. 大数据的特点不包括下面哪一项_____( )_____。

选项:

A. 巨大的数据量

B. 多结构化数据

C. 增长速度

D. 价值密度高
二 简答题

答案: 价值密度高
二 简答题

问题 3: 3. 大数据具有哪些特点?

选项:

A. 数据的“大量化”

B. 数据的“快速化”

C. 数据的“多样化”

D. 数据的“价值化”

答案: 数据的“大量化”

问题 4: 4. 下面哪些属于大数据的应用领域?

选项:

A. 智能医疗研发

B. 监控身体情况

C. 实时掌握交通状况

D. 金融交易

答案: 智能医疗研发

问题 5: 5. 下列哪一个不属于Hadoop大数据层的功能? ( )

选项:

A. 数据挖掘

B. 离线分析

C. 实时查询

D. BI分析

答案: 实时查询

问题 6: 1. 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功? ( )

选项:

A. Namenode,Datanode, TaskTracker

B. Namenode,Datanode, secondaryNameNode

C. Namenode,Datanode, Hmaster

D. Namenode,JobTracker, secondaryNameNode

答案: Namenode,JobTracker, secondaryNameNode

问题 7: 2. 分布式文件系统指的是什么? ( )

选项:

A. 把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群

B. 用于在Hadoop与传统数据库之间进行数据传递

C. 一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统

D. 一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据

答案: 请关注公众号【渝粤搜题】查看答案

问题 8: 3. 关于Hadoop单机模式和伪分布式的说法正确的是( )

选项:

A. 两者都启动守护进程,且守护进程运行在一台机器上

B. 单机模式不使用HDFS,但加载守护进程

C. 两者都不与守护进程交互,避免复杂性

D. 后者比前者增加了HDFS输入输出以及可检查内存使用情况

答案: 请关注公众号【渝粤搜题】查看答案

问题 9: 4. 如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 10: 5. Slave节点要存储数据,所以它的磁盘越大越好。

选项:

答案: 请关注公众号【渝粤搜题】查看答案

问题 11: 1. HDFS中的block默认保存几份。 ( )

选项:

A. 3

B. 2

C. 1

D. 不确定

答案: 请关注公众号【渝粤搜题】查看答案

问题 12: 2. 下列哪一项不属于HDFS采用抽象的块概念带来的好处? ( )

选项:

A. 强大的跨平台兼容性

B. 支持大规模文件存储

C. 简化系统设计

D. 适合数据备份

答案: 请关注公众号【渝粤搜题】查看答案

问题 13: 3. 下面对FsImage的描述,哪个是错误的? ( )

选项:

A. FsImage文件没有记录文件包含哪些块以及每个块存储在哪个数据节点

B. FsImage文件包含文件系统中所有目录和文件inode的序列化形式

C. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据

D. FsImage文件记录了所有针对文件的创建、删除、重命名等操作

答案: 请关注公众号【渝粤搜题】查看答案

问题 14: 4. 下面对SecondaryNameNode第二名称节点的描述,哪个是错误的? ( )

选项:

A. 它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

B. SecondaryNameNode一般是并行运行在多台机器上

C. SecondaryNameNode通过HTTP GET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下

D. SecondaryNameNode是HDFS架构中的一个组成部分

答案: 请关注公众号【渝粤搜题】查看答案

问题 15: 5. 一个gzip文件大小75MB,客户端设置Block大小为64MB,请问其占用几个Block?

选项:

A. 1

B. 2

C. 3

D. 4

答案: 请关注公众号【渝粤搜题】查看答案

问题 16: 6. HDFS有一个LZO(with index)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为( )

选项:

A. 一个map读取64MB,另外一个map读取11MB

B. 64M

C. 75M

D. 60M

答案: 请关注公众号【渝粤搜题】查看答案

问题 17: 7. 配置机架感知的好处,下面哪项( )不正确。

选项:

A. 如果一个机架出问题,不会影响数据读写

B. 写入数据的时候会写到不同机架的DataNode中

C. MapReduce会根据机架获取离自己比较近的网络数据

D. 各个机架之间不需要有网络

答案: 请关注公众号【渝粤搜题】查看答案

问题 18: 8. 关于 SecondaryNameNode 哪项是正确的( )

选项:

A. 它是 NameNode 的热备

B. 它对内存没有要求

C. 它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间

D. SecondaryNameNode 应与 NameNode 部署到一个节点

答案: 请关注公众号【渝粤搜题】查看答案

问题 19: 1. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是( )。

选项:

A. 一次写入,少次读

B. 多次写入,少次读

C. 多次写入,多次读

D. 一次写入,多次读

答案: 请关注公众号【渝粤搜题】查看答案

问题 20: 1. 关于SecondaryNameNode哪项是正确的?( )

选项:

A. 它是NameNode的热备

B. 它对内存没有要求

C. 它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间

D. SecondaryNameNode应与NameNode部署到一个节点

答案: 请关注公众号【渝粤搜题】查看答案

问题 21: 2. 下面哪项负责HDFS数据存储。( )

选项:

A. NameNode

B. client

C. Datanode

D. secondaryNameNode

答案: 请关注公众号【渝粤搜题】查看答案

问题 22: 3. 下列哪个程序通常与NameNode在一个节点启动?( )

选项:

A. NameNode

B. Datanode

C. TaskTracker

D. Jobtracker

答案: 请关注公众号【渝粤搜题】查看答案

问题 23: 4. HDFS采用了什么模型?

选项:

A. 主从结构模型

B. 分层模型

C. 管道-过滤器模式

D. 点对点模式

答案: 请关注公众号【渝粤搜题】查看答案

问题 24: 5. 数据节点(DataNode)的主要功能包括哪些?( )

选项:

A. 负责数据的存储和读取

B. 根据客户端或者是名称节点的调度来进行数据的存储和检索

C. 用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

D. 向名称节点定期发送自己所存储的块的列表

答案: 请关注公众号【渝粤搜题】查看答案

电话咨询