23春大数据技术导论试卷包-05
23春大数据技术导论试卷包-05
关注公众号【飞鸟搜题】,回复【试题】获取试卷答案
文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
一 、判断题
1. 通常一个作业的输入都是基于分布式文件系统的文件,而对于一个 Map任务而言,它的输入是输入文件的一个数据块,或者是数据块的一部分,也可跨越数据块。()
√
×
答案:B- 关注公众号【飞鸟搜题】查看答案
2. 系统抽样又称为等距抽样,当总体中个体数少,且其分布没有明显的不均匀情况时,常采用系统抽样。()
√
×
答案:B- 关注公众号【飞鸟搜题】查看答案
3. 数值约简是利用替代的方式,使用较小的数据表示替换或估计数据,进而可以减少数据量。()
√
×
答案:A- 关注公众号【飞鸟搜题】查看答案
4. 批量计算是一种在线计算,支持海量作业 并发规模,系统自动完成资源管理、作业调度和数据加载,并按实际使用量计费。()
√
×
答案:B- 关注公众号【飞鸟搜题】查看答案
5. 为了更有效地处理数据,应该尽可能地限制静态数据。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
6. 气泡图是柱状图的一种变体,通过每个点的面积大小来反映第三维。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
7. 由大及小的可视化展现方式是:先给出一个整体的画面,可以引导阅读者具体深入到一个聚焦的点。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
8. 通用网络爬虫又称为全网爬虫,其可将爬行对象从一些种子 URL扩充到整个 Web,主要为门户站点搜索引擎和大型 Web服务采集数据。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
9. 在互联网营销中,用户反馈承担的核心任务是为产品收集用户舆情信息。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
10. 探索性数据分析强调灵活探求线索和证据,而证实性数据分析则着重评估现有证据。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
11. 一次移动平均法仅适用于没有明显的迅速上升或下降趋势的情况,如果时间数列呈直线上升或下降趋势,则需要使用二次移动平均法。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
12. 准确性、完整性、一致性和及时性称为数据质量的四要素。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
二 、单选题
1. 下列不属于基于时间戳的增量数据抽取方式的优点的是()?
性能优异
系统设计清晰
数据抽取简单
对业务系统无其他要求
答案:关注公众号【飞鸟搜题】查看答案
2. 下列不会造成文本记录重复相似的是()?
插入
交换
等价表述
删除冗余
答案:关注公众号【飞鸟搜题】查看答案
3. 下列不属于指数平滑法的适用范围的是()?
稳定变化态势的时间序列数据
不稳定变化的时间序列数据
规则变化的时间序列数据
直线上升或下降趋势的时间序列数据
答案:关注公众号【飞鸟搜题】查看答案
4. Z分数规范化方法依据的是原始数据的()?
均值和中位数
中位数和极差
极差和方差
均值和标准差
答案:关注公众号【飞鸟搜题】查看答案
5. 下列不属于文本数据语义特征的是()?
词频
逻辑结构
动态演化规律
数据结构
答案:关注公众号【飞鸟搜题】查看答案
6. 文本数据是典型的()?
结构化数据
半结构化数据
非结构化数据
混合结构数据
答案:关注公众号【飞鸟搜题】查看答案
7. 下面是数据科学的主要研究内容的是()?
数据泄露
数据交易
数据盗窃
数据分析
答案:关注公众号【飞鸟搜题】查看答案
8. 下面不属于流式数据的特点的是()?
实时性
层次性
易失性
突发性
答案:关注公众号【飞鸟搜题】查看答案
9. MapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。
作业
任务
作业服务器
任务服务器
答案:关注公众号【飞鸟搜题】查看答案
10. MapReduce以什么方式进行分布式计算()?
文本
函数
数据集
矩阵
答案:关注公众号【飞鸟搜题】查看答案
11. 下列不属于特征约简的步骤的是()?
搜索过程
填补过程
评估过程
分类过程
答案:关注公众号【飞鸟搜题】查看答案
12. 下列不属于信息孤岛带来的问题的是()?
数据不能共享
冗余数据
数据优化
垃圾数据
答案:关注公众号【飞鸟搜题】查看答案
13. 下列属于意见建议类用户反馈的特点的是()?
反馈量大
反馈速度快
针对性强
传播快
答案:关注公众号【飞鸟搜题】查看答案
14. 下列属于聚焦网络爬虫的特点的是()?
数量巨大
范围较大
精准筛选
爬行速度慢
答案:关注公众号【飞鸟搜题】查看答案
15. 下列不属于数据分散性特征的是()?
均值
极差
方差
变异系数
答案:关注公众号【飞鸟搜题】查看答案
16. 下列不属于回归分析的类别的是()?
一元回归分析
二元回归分析
多元回归分析
线性回归分析
答案:关注公众号【飞鸟搜题】查看答案
三 、问答题
1. 数据约简的定义是?
答案:关注公众号【飞鸟搜题】查看答案
2. 地图的构成要素有哪些?请简要说明并解释每种要素的含义。
答案:关注公众号【飞鸟搜题】查看答案
3. 什么是相关分析?
答案:关注公众号【飞鸟搜题】查看答案
4. 分箱平滑法的定义是?
答案:关注公众号【飞鸟搜题】查看答案
5. 互联网大数据的定义是?
答案:关注公众号【飞鸟搜题】查看答案
6. 图像数字化的定义?
答案:关注公众号【飞鸟搜题】查看答案
7. 请简述MapReduce的计算过程?
答案:关注公众号【飞鸟搜题】查看答案
关注公众号【飞鸟搜题】,回复【试题】获取试卷答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。