23春大数据技术导论试卷包-02
23春大数据技术导论试卷包-02
关注公众号【飞鸟搜题】,回复【试题】获取试卷答案
文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
本文由【飞鸟搜题】微信公众号提供,禁止复制盗取,违者必究
一 、判断题
1. MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要生成一个输出元素。()
√
×
答案:A- 关注公众号【飞鸟搜题】查看答案
2. 特征约简是在保留、提高原有判别能力的前提下,从原有的特征中删除不重要或不相关的特征,或者通过对特征进行重组来减少特征的个数,同时减少特征向量的维度。()
√
×
答案:A- 关注公众号【飞鸟搜题】查看答案
3. 数据约简是指在对挖掘任务和数据本身内容理解的基础之上,寻找依赖于发现目标特征的有用数据,以缩减数据规模,从而在尽可能保持数据原貌的前提下,最大限度地精简数据量。()
√
×
答案:A- 关注公众号【飞鸟搜题】查看答案
4. Cyber空间是指以计算机技术、现代通信网络技术、虚拟现实技术等信息技术的综合运用为基础,以知识和信息为内容的新型空间。()
√
×
答案:A- 关注公众号【飞鸟搜题】查看答案
5. 流式数据的处理是批量处理。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
6. 文本数据是典型的结构化数据类型。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
7. 多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
8. 图像信息获取的方法只有扫描技术。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
9. 大数据的获取要避免重复数据。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
10. 从分析的结果上来看,大数据分析主要分为探索性数据分析、证实性数据分析、定性数据分析;从分析的方式上来看,大数据分析主要分为离线数据分析、在线数据分析和交互式分析。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
11. 数据转换可将原始数据转换成适合数据分析的形式,如果数据转换处理不当,将严重扭曲数据本身的内涵,改变数据原本的形态。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
12. 数据清洗是数据预处理的重要部分,其主要工作是检查数据的完整性及数据的一致性, 对其中的噪声数据进行平滑,对丢失的数据进行填补,以及对重复的数据进行消除等。()
√
×
答案:关注公众号【飞鸟搜题】查看答案
二 、单选题
1. 下列不属于文本相似度计算流程的是()?
文本排序
文本分词
统计词频
写出词频向量
答案:关注公众号【飞鸟搜题】查看答案
2. 数据清洗算法的衡量标准主要包含 ( )、错误返回率和精确度。
冗余度
返回率
可用性
一致性
答案:关注公众号【飞鸟搜题】查看答案
3. 下列不属于指数平滑法的适用范围的是()?
稳定变化态势的时间序列数据
不稳定变化的时间序列数据
规则变化的时间序列数据
直线上升或下降趋势的时间序列数据
答案:关注公众号【飞鸟搜题】查看答案
4. Z分数规范化方法中,下列可以替换标准差的是()?
均值
方差
极差
平均值绝对偏差
答案:关注公众号【飞鸟搜题】查看答案
5. 下列不属于地图的构成要素的是()?
图形要素
价格要素
数学要素
辅助要素
答案:关注公众号【飞鸟搜题】查看答案
6. 基于任务的定义和分类,下列不属于可视分析关注点的是()?
以用户价值为关注点
以用户意图为关注点
以同户行为为关注点
以软件操作为关注点
答案:关注公众号【飞鸟搜题】查看答案
7. 下面不属于互联网大数据的是()?
视频
图片
音频
心情
答案:关注公众号【飞鸟搜题】查看答案
8. 下面不是研究数据方法的是()?
统计学
机器学习
心理分析
数据挖掘
答案:关注公众号【飞鸟搜题】查看答案
9. 下列不属于单词计数的Map过程的是()?
按列分割文件
分词处理
按行分割文件
排序与合并
答案:关注公众号【飞鸟搜题】查看答案
10. Hadoop作业服务器不负责()?
接受用户提交的作业
任务的分配
执行具体的任务
管理所有的任务服务器
答案:关注公众号【飞鸟搜题】查看答案
11. 下列不属于无参数值约简技术的是()?
直方图
聚类
选择
线性回归模型
答案:关注公众号【飞鸟搜题】查看答案
12. 下列不属于数据约简的特点()?
计算量巨大
成本降低
较少存储量
方便分类
答案:关注公众号【飞鸟搜题】查看答案
13. 下列不属于NoSQL数据库的键值式存储的常见形式的是()?
临时型
附加型
混合型
永久型
答案:关注公众号【飞鸟搜题】查看答案
14. 下列不属于通用网络爬虫的结构的是()?
页面爬行模块
页面分析模块
页面数据库
页面修改模块
答案:关注公众号【飞鸟搜题】查看答案
15. 下列不属于判别方法的是()?
最大似然法
最小二乘法
距离判别法
贝叶斯判别法
答案:关注公众号【飞鸟搜题】查看答案
16. 下列不属于相关系数的是()?
简单相关系数
复相关系数
典型相关系数
常态相关系数
答案:关注公众号【飞鸟搜题】查看答案
三 、问答题
1. 什么是数值约简?数值约简技术可以分为哪两类?
答案:关注公众号【飞鸟搜题】查看答案
2. 根据信息的特征,可以将信息可视化划分为哪些类别?
答案:关注公众号【飞鸟搜题】查看答案
3. 数据分析与数据挖掘的主要区别是?
答案:关注公众号【飞鸟搜题】查看答案
4. 移动平均法的定义是?
答案:关注公众号【飞鸟搜题】查看答案
5. 数据科学的定义?
答案:关注公众号【飞鸟搜题】查看答案
6. 大数据获取的定义?
答案:关注公众号【飞鸟搜题】查看答案
7. 请简述MapReduce的基本原理。
答案:关注公众号【飞鸟搜题】查看答案
关注公众号【飞鸟搜题】,回复【试题】获取试卷答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。