百年教育职业培训中心 百年教育学习服务平台
国开搜题

中国大学MOOC大数据算法考核作业参考原题试题 (2)

来源: 更新时间:

2024秋最新《中国大学MOOC大数据算法考核作业参考原题试题(2)》形考作业试题题库、期末题库考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习


2024秋最新《中国大学MOOC大数据算法考核作业参考原题试题 (2)》形考作业试题题库、期末题库

考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。

课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

大数据算法

学校: 无

问题 1: 1. 以下选项中,大数据涉及的领域中包括()。

选项:

A. 社交网络

B. 医疗数据

C. 计算机艺术

D. 医疗数据

答案: 社交网络

问题 2: 2. 大数据的应用包括()。

选项:

A. 预测

B. 推荐

C. 商业情报分析

D. 科学研究

答案: 预测

问题 3: 3. 以下关于大数据的特点,叙述错误的是()。

选项:

A. 速度慢

B. 多元、异构

C. 数据规模大

D. 基于高度分析的新价值

答案: 速度慢

问题 4: 4. 目前,关于大数据已有公认的确定定义。

选项:

答案: 错误

问题 5: 5. 大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()

选项:

答案: 正确

问题 6: 1. 在大数据求解计算问题中,判断是否为能行可计算的因素包括()。

选项:

A. 数据量

B. 资源约束

C. 速度约束

D. 时间约束

答案: 数据量

问题 7: 2. 大数据求解计算问题过程的第三步一般是()。

选项:

A. 判断可计算否

B. 判断能行可计算否

C. 算法设计与分析

D. 用计算机语言实现算法

答案: 请关注公众号【大象答案】查看答案

问题 8: 3. 大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 9: 1. 大数据算法的()特点,使其与大数据算法密切相关的。

选项:

A. 数据量大

B. 基于高度分析的新价值

C. 速度快

D. 多样性、复杂性

答案: 请关注公众号【大象答案】查看答案

问题 10: 2. 众包算法是用来解决()。

选项:

A. 访问全部数据时间过长

B. 数据难于放入内存计算

C. 单个计算机难以保存全部数据,计算需要整体数据

D. 计算机计算能力不足或知识不足,需要人来帮忙

答案: 请关注公众号【大象答案】查看答案

问题 11: 3. 为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 12: 1. 下列选项中,属于智能仿生算法的是()。

选项:

A. 遗传算法

B. 近似算法

C. 模拟退火算法

D. 数据流算法

答案: 请关注公众号【大象答案】查看答案

问题 13: 2. 随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 14: 3. 对于数据流算法或在线算法,经常要分析结果的近似比。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 15: 4. 在线算法/数据流算法是面向大数据速度快的特点提出的。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 16: 1. 亚线性是指()等的消耗是输入规模o。()

选项:

A. 时间

B. 空间

C. IO

D. 通讯

答案: 请关注公众号【大象答案】查看答案

问题 17: 2. 计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。

选项:

A. n²

B. n+1

C. 2n

D. n-1

答案: 请关注公众号【大象答案】查看答案

问题 18: 1. 在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 19: 1. 利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。

选项:

A. 二分之一

B. 三分之一

C. 四分之一

D. 十分之一

答案: 请关注公众号【大象答案】查看答案

问题 20: 2. 采用平面图的直径近似算法的动机是无法在要求的时间内得到()。

选项:

A. 相似解

B. 完整解

C. 精确解

D. 近似解

答案: 请关注公众号【大象答案】查看答案

问题 21: 3. Ratio Bound越大,则近似解越坏。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 22: 4. 近似算法能给出一个优化问题的优化解。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 23: 5. 在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 24: 1. 在判定问题的近似中,对于近似解需要区分的是()。

选项:

A.

B.

C. 差不离

D. 差得很远

答案: 请关注公众号【大象答案】查看答案

问题 25: 2. 全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 26: 1. 频繁元素计算算法有效的原因是源于()。

选项:

A. 取近似解

B. 证据引理

C. 错误界限和k成反比

D. Zipf原则

答案: 请关注公众号【大象答案】查看答案

问题 27: 2. 在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 28: 3. 在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 29: 1. 如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 30: 1. 当内存不够或者算法设计不好时,如果数据量达到一定规模以上,运行时间会急剧增加。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 31: 2. 现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 32: 1. 外存归并排序,以()为单位进行调度。

选项:

A. 比特

B.

C.

D.

答案: 请关注公众号【大象答案】查看答案

问题 33: 1. 在外排序的快速排序中,分割元素的选择非常重要。

选项:

A. 正确

B. 错误

答案: 请关注公众号【大象答案】查看答案

问题 34: 1. 在内存中的二分搜索树中,通常使用()来维护树的平衡。()

选项:

A. 置换

B. 分裂

C. 旋转

D. 合并

答案: 请关注公众号【大象答案】查看答案

问题 35: 2. 二叉搜索树是在n个元素之间搜索的标准方法,一般把元素保存在根处。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 36: 1. 如果T是一个(a,b)-树(a≧2且b≧2a-1),其根结点的度在()之间。

选项:

A. 2a

B. 2b

C. ab

D. 24

答案: 请关注公众号【大象答案】查看答案

问题 37: 2. 在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 38: 1. 元素都在叶子中的B-树有时被称为()。

选项:

A. B+

B. B-+

C. B+-

D. B+-

答案: 请关注公众号【大象答案】查看答案

问题 39: 2. 关于(a,b)—树的删除操作,删除操作出现问题的情形是:从叶子v删除元素后,v的儿子小于a-1个。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 40: 1. 对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。

选项:

A. O (sort(N))

B. O(scan(N))

C. O(scan(N))IO

D. IO(scan(N))

答案: 请关注公众号【大象答案】查看答案

问题 41: 2. 为数T的每个结点标上子树大小的I/O复杂度为()。

选项:

A. IO (sort(N))

B. O (sort(N))

C. IO(scan(N))

D. O(scan(N))

答案: 请关注公众号【大象答案】查看答案

问题 42: 3. 图中的独立集是指图当中点的集合,其任意两点之间不存在边。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 43: 4. 外存算法最坏情况的I/O数位Ω(N)。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 44: 1. 求最大独立集的基本思想是使用贪心法。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 45: 1. 图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。

选项:

A. 自举

B. 缩图法

C. 时间前向处理

D. 连通分量

答案: 请关注公众号【大象答案】查看答案

问题 46: 2. 在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 47: 3. 图的连通性算法可扩增为求图G最小生成树(MST)的算法。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 48: 1. MapReduce的执行框架处理的内容包括()。

选项:

A. 调度

B. 数据分布

C. 将中间数据进行聚集、排序或洗牌

D. 进行错误处理

答案: 请关注公众号【大象答案】查看答案

问题 49: 2. MapReduce是由()开发的分布式编程模型。

选项:

A. Microsoft

B. Google

C. Tencent

D. Alibaba Group

答案: 请关注公众号【大象答案】查看答案

问题 50: 3. 在实现MapReduce程序时,需要注意的事项不包括()。

选项:

A. 避免创建对象

B. 避免缓冲

C. 避免通信

D. 避免MapperReducer间的全局变量传递

答案: 请关注公众号【大象答案】查看答案

问题 51: 4. Map()和Reduce()两个函数不能够并行运行。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 52: 1. 在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。

选项:

A. 序列

B. 基数

C. 集合

答案: 请关注公众号【大象答案】查看答案

问题 53: 1. combiner的运行次数可能有多次。

选项:

答案: 请关注公众号【大象答案】查看答案

问题 54: 1. 用单词共现矩阵解决大规模计数问题的基本方法是()。

选项:

A. Mapper生成部分计数

B. Reducer生成部分计数

C. Reducer聚合部分计数

D. Mapper聚合部分计数

答案: 请关注公众号【大象答案】查看答案

问题 55: 2. 关于单词共现矩阵的计算,说法正确的是()。

选项:

A. 计算文本集合中词的共现矩阵

B. 词的个数如果为N,输出为M*N的矩阵

C. 是一种测量语义距离的方法

D. 语义距离可用于许多语言处理任务

答案: 请关注公众号【大象答案】查看答案

问题 56: 3. “条纹法”的优点有()。

选项:

A. 易于实现

B. key-value对的排序和洗牌少得多

C. 潜在对象更大

D. 能更好地利用combiner

答案: 请关注公众号【大象答案】查看答案

问题 57: 4. f(B|A)词对法必须确定所有a被传递到同一个combiner。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 58: 5. “词对法”的缺点是不易实现,排序和洗牌代价高。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 59: 1. 在基于路径的算法中,边的标记包括()。

选项:

A. 代价

B. 距离

C. 相似性

D. 属性

答案: 请关注公众号【大象答案】查看答案

问题 60: 2. 基于路径的算法的例子不包括()。

选项:

A. 单源最短路径

B. 最小生成树

C. 分布式不动点运算

D. 拓扑排序

答案: 请关注公众号【大象答案】查看答案

问题 61: 3. Dijkstra算法需要并行化。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 62: 1. 缓存迭代的方法是()。

选项:

A. Mapper前加入输入缓存

B. Mapper后加入输出缓存

C. Reducer前加入输入缓存

D. Reducer后加入输出缓存

答案: 请关注公众号【大象答案】查看答案

问题 63: 2. MapReduce是一种非递归描述性语言的通用运行平台。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 64: 1. 下列属于众包应用的例子有()。

选项:

A. 验证码

B. 机器翻译

C. 图像搜索

D. 数据库查询

答案: 请关注公众号【大象答案】查看答案

问题 65: 2. 目前众包技术已经可以判断两幅画在艺术风格上是否一致。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 66: 3. 众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 67: 1. 用机器完成众包的优势有()。

选项:

A. 省钱

B. 省时

C. 数量大

D. 质量高

答案: 请关注公众号【大象答案】查看答案

问题 68: 2. 基于簇的HIT生成问题的优化目标是生成最小数目基于簇的HIT。()

选项:

答案: 请关注公众号【大象答案】查看答案

问题 69: 3. 目前众包技术完全由计算机来完成。()

选项:

答案: 请关注公众号【大象答案】查看答案

电话咨询