百年教育职业培训中心 百年教育学习服务平台
题库试卷

【广开搜题】广东开放大学大数据概论(专,2024春)形成性考核测验1(35)1_1参考答案 (2)

来源: 更新时间:

【广开搜题】广东开放大学大数据概论(专,2024春)形成性考核测验1(35)1_1参考答案试卷总分:100得分:2001.关于聚类挖掘,表述错误的是:A.好的聚类结果应该有高类内相似性和低类间相似性这

【广开搜题】广东开放大学大数据概论(专,2024春)形成性考核测验1351_1参考答案


试卷总分:100 得分:200

1.关于聚类挖掘,表述错误的是:

A.好的聚类结果应该有高类内相似性和低类间相似性这样的特征

B.好聚类的方法的标准是要产生高质量的聚类结果

C.聚类结果的好坏取决于相似性的度量方法以及具体实现

D.聚类结果的好坏与能否发现隐含模式无关

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


2.什么是存储在计算机内有结构的数据的集合?

A.数据库

B.数据库系统

C.数据库管理系统

D.数据库结构

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


3.哪个不属于知识发现的步骤

A.数据选择

B.数据集成

C.数据开发

D.数据清理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


4.不属于社交网络特点的是

A.完整数据

B.实时数据

C.数据单一

D.海量用户

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


5.单舆情的系统架构正确的是

A.规划-存储-分析-采集-报告-管控

B.规划-采集-存储-分析-报告-管控

C.规划-采集-分析-存储-报告-管控

D.规划-存储-采集-分析-报告-管控

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


6.以下不属于网络舆情的主要来源的是

A.论坛与BBS渝粤题库

B.微信

C.QQ

D.书信

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


7.大数据可能带来(),但未必能够带来()

A.精确度;准确度

B.多样性;准确度

C.精确度;多样性

D.准确度;精确度

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤搜题

8.数据清洗的方法不包括( )。

A.噪声数据清除

B.一致性检查

C.重复数据记录处理

D.缺失值处理

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


9.计量单位从低到高,下面的说法正确的是( )

A.EB< MB< GB< TB

B.KB< MB< GB< TB

C.EB< KB< MB< TB

D.GB< KB< MB< TB

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广开形成性考核答案


10.智能健康手环的应用开发,体现了( )的数据采集技术的应用

A.网络爬虫

B.API接口

C.统计报表

D.传感器

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


11.属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感

A.①②③④⑤⑥

B.①③⑤

C.②④⑥渝粤教育

D.①③⑥

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


12.社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。

A.0

B.maxφpq

C.maxφpq≤0

D.maxφpq<0

E.maxφpq≥0

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


13.以下说法错误的是

A.关联规则在使用时的两个指标是支持度和置信度

B.FP-树频集算法是针对Apriori算法缺点进行改进后的算法

C.FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的

D.APRIORI算法最大的缺点是复杂度太高

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


14.关联规则的基本概念中错误的是

A.置信度是项集出现次数除以总的交易次数

B.K项集指的是K个项的集合

C.项集频率指的是项集所有交易中出现的次数

D.相对支持度指的是项集出现次数除以总的交易次数

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


15.K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量

A.①②③④⑤

B.①③

C.②④

D.①③⑤

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


16.什么是大数据使用的最可靠方法?

A.大数据源

B.样本数据源

C.规模大

D.大数据与样本数据结合广开搜题

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


17.下列关于数据重组的说法中,错误的是( )。

A.数据重组实现的关键在于多源数据融合和数据集成

B.数据重组是数据的重新生产和重新采集

C.数据重组能够使数据焕发新的光芒

D.数据重组有利于实现新颖的数据模式创新

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


18.大数据的最显著特征是( )。

A.数据处理速度快

B.数据规模大

C.数据类型多样

D.数据价值密度高

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


19.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。

A.在分析效果上更追究效率而不是绝对精确

B.在数据规模上强调相对数据而不是绝对数据

C.在分析方法上更注重相关分析而不是因果分析

D.在数据基础上倾向于全体数据而不是抽样数据

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


20.下列关于舍恩伯格对大数据特点的说法中,错误的是( )。

A.数据类型多样

B.数据处理速度快

C.数据规模大

D.数据价值密度高

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


21.单选 Hive的数据计算使用

A.HBASE

B.PIG

C.HDFS

D.MapReduce

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


22.单选 Hadoop生态系统中,最核心的设计是()

A.HIVE和HDFS

B.TEZ和PIG

C.HDFS和MAPREDUCE

D.HBASE和STORM

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


23.单选 Web挖掘中内容挖掘的基本技术是()

A.技术挖掘

B.数据挖掘

C.文本挖掘

D.图片挖掘

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


24.布尔权重是指如果某个词条在一篇文本中出现,则将其权值定义为(),否则定义为()

A.0,1

B.1,0

C.0,2

D.2,0

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


25.以下哪个不是推荐系统的评测指标

A.惊喜度

B.新颖性

C.统一性

D.覆盖率

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

广开形成性考核答案

26.分类变量使用( )建立预测模型。

A.回归树

B.离散树

C.分类树

D.决策树

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


27.对线下零售而言,做好大数据分析应用的前提是( )

A.扩大营业面积

B.增加统计种类

C.开展优惠促销

D.增加数据来源

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


28.万维网的实施国家是( )

A.美国

B.德国

C.印度

D.英国

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


29.一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( )

A.相关思维

B.实验思维

C.因果思维

D.定量思维

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


30.下列关于网络用户行为的说法中,错误的是( )。

A.用户离散的交互痕迹能够为企业提升服务质量提供参考

B.网络公司能够捕捉到用户在其网站上的所有行为

C.用户的隐私安全很难得以规范保护

D.数字轨迹用完即自动删除

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


31.以下说法正确的是

A.Spark只能基于HDFS这样分布式文件存储系统

B.Spark只能基于Tachyon这样基于内存分布式文件存储系统

C.Spark既无法基于HDFS这样分布式文件存储系统也无法基于Tachyon这样基于内存分布式文件存储系统

D.Spark可以基于HDFS这样分布式文件存储系统也可以基于Tachyon这样基于内存分布式文件存储系统

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


32.能同时进行交互式计算,批处理,流式计算的计算框架为

A.Impala

B.Shark

C.Storm

D.Spark

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


33.Storm属于()计算

A.批处理

B.流式

C.云

D.交互式

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


34.Spark生态图中,()提供了图存储结构和常见的图算法

A.Tachyon

B.SharkSQL

C.SparkStreaming

D.GraphxGraphParallel

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


35.中国互联网购物者占互联网使用者的比例为:

A.0.57

B.0.56

C.0.5

D.0.55

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


36.RDD中进行map,filter,groupBy等操作属于()

A.Acter

B.Transformation

C.Active

D.Change

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


37.大数据时代,数据使用的关键是( )。

A.数据收集

B.数据存储

C.数据再利用

D.数据分析

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


38.下列关于数据交易市场的说法中,错误的是( )。

A.数据交易市场是大数据资源化的必然产物

B.数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

C.商业化的数据交易活动催生了多方参与的第三方数据交易市场

D.数据交易市场是大数据产业发展到一定程度的产物

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


39.数据仓库的最终目的是( )。

A.收集业务需求

B.为用户和业务部门提供决策支持

C.建立数据仓库逻辑模型

D.开发数据仓库的应用分析

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


40.大数据的最显著特征是( )。

A.数据规模大

B.数据价值密度高

C.数据类型多样

D.数据处理速度快

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


41.K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量

A.②④

B.①③⑤

C.①③

D.①②③④⑤广开形成性考核答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


42.关于内容深度理解建立索引说法正确的是

A.内容索引与客观因素有很大关系

B.内容索引又可以分为单索引和双索引

C.客观索引与文档内容有关

D.索引分为客观索引和主观索引

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


43.中国的网络消费者比线下消费者更( )。

A.年轻和贫困

B.年轻和富裕

C.年老和富裕

D.年老和贫困

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


44.大数据获取的个人信息比传统调研获得的个人信息真实性( )。

A.相同

B.更低

C.不确定

D.更高

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


45.DMP分为( )和( )。

A.开放式DMP;私有式DMP

B.单一式DMP;封闭式DMP

C.单一式DMP;多元式DMP

D.开放式DMP;封闭式DMP

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


46.阿里巴巴旗下的数据管理平台,被称为:

A.达摩盘

B.蚂蚁花呗

C.招财宝

D.支付宝

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


47.万维网之父是( )。

A.斯科特?布朗

B.舍恩伯格

C.蒂姆?伯纳斯-李

D.彼得?德鲁克

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


48.Mac OS系统的开发者是()。

A.IBM公司

B.微软公司

C.惠普公司

D.苹果公司

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案渝粤题库


49.下列论据中,能够支撑"大数据无所不能”的观点的是( )。

A.大数据具有非常高的成本

B.大数据存在泡沫

C.互联网金融打破了传统的观念和行为

D.个人隐私泄露与信息安全担忧

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


50.Spark生态图中,()提供了一个机器学习的算法库

A.Tachyon

B.SharkSQL

C.GraphxGraphParallel

D.MLBaseMachineLearning

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


51.()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库

A.STORM

B.MAPREDUCE

C.MaHout

D.YARN

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


52.特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()

A.越大,越大

B.越大,越小

C.越小,越小

D.越小,越大

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


53.RDD中进行count,collect,save等操作属于()

A.Active

B.Change

C.Transformation

D.Acter

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


54.根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性渝粤题库,我们的目标是要做全覆盖、全正确的答案搜索服务。

A.没有被多次引用的页面

B.页面的重要性无法传递

C.被多次引用的页面

D.被非重要的页面引用的页面

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


55.Web应用挖掘中最有效而且简单的分析方法是

A.内容分析

B.点击流分析

C.数据挖掘

D.结构分析

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广开形成性考核答案


56.Hadoop生态系统中,集群的资源管理系统是()

A.YARN

B.MAPREDUCE

C.STORM

D.HDFS

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


57.Hadoop提供的MapReduce的编程方式中,()是最原始的方式

A.PHP

B.Java

C.HadoopStreaming

D.HadoopPipes

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


58.大数据的起源是( )

A.公共管理

B.金融

C.电信

D.互联网

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


59.智慧城市的智慧之源是( )

A.大数据

B.物联网

C.云计算

D.数字城市

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


60.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系

A.相关因果

B.因果并列

C.因果相关

D.并列相关

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


61.传统大数据质量清洗的特点有:

A.确定性

B.强类型性

C.非确定性

D.协调式的

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


62.以下选项中属于数据的作用的是( )。

A.验证假设

B.建立信心

C.欣赏

D.沟通

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


63.慈铭体检机构的 O2O健康管理产品,由( )组成。渝粤搜题

A.手机APP

B.健康管理云平台广东开放大学作业答案

C.保健品

D.智能运动手腕

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


64.当前大数据技术的基础包括( )

A.分布式数据库

B.分布式文件系统

C.分布式并行计算

D.关系型数据库

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


65.可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )

A.提供高性能并行计算技术的强力支撑

B.能够直观反映成对数据之间的空间关系

C.能够静态演化事物的变化及变化的规律

D.能够动态演化事物的变化及变化的规律

E.能够直观反映多维数据之间的空间关系

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


66.下列关于计算机存储容量单位换算关系的公式中,正确的是( )

A.1GB=1024KB

B.1GB=1012KB

C.1GB=1024MB

D.1KB=1012Byte

E.1KB=1024Byte

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


67.避免"数据孤岛”的方法包括:

A.数据输入

B.利用样本框

C.数据融合

D.关键匹配变量

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


68.以下属于机器学习的是:

A.监督式学习

B.半监督式学习

C.非监督式学习

D.强化学习

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


69.机器学习的四大类分析技术的主要算法包括()

A.分类与预测

B.描述性统计

C.聚类分析

D.关联分析

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


70.大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?广开形成性考核答案

A.数据很大

B.变化很快

C.构成复杂

D.蕴含大价值

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


71.用户建模模块的功能是

A.对用户进行识别和分类

B.获取、表示用户的兴趣偏好

C.存储或者修改用户的兴趣偏好

D.帮助用户找到需要的东西

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


72.下列关于脏数据的说法中,正确的是( )。

A.格式不规范

B.编码不统一

C.数据不完整

D.与实际业务关系不大

E.意义不明确广开形成性考核答案

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


73.2012年"中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。

A.市场流通

B.农业生产经营

C.文化交流

D.质量安全控制

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案

渝粤搜题

74.传统数据密集型行业积极探索和布局大数据应用的表现是( )。

A.打通多源跨域数据

B.提高分析挖掘能力

C.自行开发数据产品

D.投资入股互联网电商行业

E.实现科学决策与运营

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


75.中国电信把自己的大数据开发分为:

A.广告类应用

B.媒体类应用

C.服务类应用

D.商品类应用

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


76.根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


77.宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


78.大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


79.大数据的起始计量单位至少是 MB。()

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


80.在没有大数据的条件下,人才的发现与选拔都很难做到"全信息”,大数据能够帮助人们解决这个问题。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


81.大数据的应用之一是,促进健康管理的个性化和多元化。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


82.由于历史的原因,我国医院的信息化建设层次不齐、水平不一。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


83.网球比赛,与其他体育项目一样,涉及大量数据。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


84.谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


85.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。

答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案


电话咨询