2024秋最新《中国大学MOOC大数据算法考核作业参考原题试题 (2)》形考作业试题题库、期末题库
考试说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究
本文由【大象答案】微信公众号提供,禁止复制盗取,违者必究

大数据算法
学校: 无
问题 1: 1. 以下选项中,大数据涉及的领域中包括()。
选项:
• A. 社交网络
• B. 医疗数据
• C. 计算机艺术
• D. 医疗数据
答案: 社交网络
问题 2: 2. 大数据的应用包括()。
选项:
• A. 预测
• B. 推荐
• C. 商业情报分析
• D. 科学研究
答案: 预测
问题 3: 3. 以下关于大数据的特点,叙述错误的是()。
选项:
• A. 速度慢
• B. 多元、异构
• C. 数据规模大
• D. 基于高度分析的新价值
答案: 速度慢
问题 4: 4. 目前,关于大数据已有公认的确定定义。
选项:
答案: 错误
问题 5: 5. 大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()
选项:
答案: 正确
问题 6: 1. 在大数据求解计算问题中,判断是否为能行可计算的因素包括()。
选项:
• A. 数据量
• B. 资源约束
• C. 速度约束
• D. 时间约束
答案: 数据量
问题 7: 2. 大数据求解计算问题过程的第三步一般是()。
选项:
• A. 判断可计算否
• B. 判断能行可计算否
• C. 算法设计与分析
• D. 用计算机语言实现算法
答案: 请关注公众号【大象答案】查看答案
问题 8: 3. 大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 9: 1. 大数据算法的()特点,使其与大数据算法密切相关的。
选项:
• A. 数据量大
• B. 基于高度分析的新价值
• C. 速度快
• D. 多样性、复杂性
答案: 请关注公众号【大象答案】查看答案
问题 10: 2. 众包算法是用来解决()。
选项:
• A. 访问全部数据时间过长
• B. 数据难于放入内存计算
• C. 单个计算机难以保存全部数据,计算需要整体数据
• D. 计算机计算能力不足或知识不足,需要人来帮忙
答案: 请关注公众号【大象答案】查看答案
问题 11: 3. 为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 12: 1. 下列选项中,属于智能仿生算法的是()。
选项:
• A. 遗传算法
• B. 近似算法
• C. 模拟退火算法
• D. 数据流算法
答案: 请关注公众号【大象答案】查看答案
问题 13: 2. 随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 14: 3. 对于数据流算法或在线算法,经常要分析结果的近似比。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 15: 4. 在线算法/数据流算法是面向大数据速度快的特点提出的。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 16: 1. 亚线性是指()等的消耗是输入规模o。()
选项:
• A. 时间
• B. 空间
• C. IO
• D. 通讯
答案: 请关注公众号【大象答案】查看答案
问题 17: 2. 计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。
选项:
• A. n²
• B. n+1
• C. 2n
• D. n-1
答案: 请关注公众号【大象答案】查看答案
问题 18: 1. 在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 19: 1. 利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。
选项:
• A. 二分之一
• B. 三分之一
• C. 四分之一
• D. 十分之一
答案: 请关注公众号【大象答案】查看答案
问题 20: 2. 采用平面图的直径近似算法的动机是无法在要求的时间内得到()。
选项:
• A. 相似解
• B. 完整解
• C. 精确解
• D. 近似解
答案: 请关注公众号【大象答案】查看答案
问题 21: 3. Ratio Bound越大,则近似解越坏。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 22: 4. 近似算法能给出一个优化问题的优化解。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 23: 5. 在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 24: 1. 在判定问题的近似中,对于近似解需要区分的是()。
选项:
• A. 是
• B. 否
• C. 差不离
• D. 差得很远
答案: 请关注公众号【大象答案】查看答案
问题 25: 2. 全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 26: 1. 频繁元素计算算法有效的原因是源于()。
选项:
• A. 取近似解
• B. 证据引理
• C. 错误界限和k成反比
• D. Zipf原则
答案: 请关注公众号【大象答案】查看答案
问题 27: 2. 在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 28: 3. 在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 29: 1. 如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 30: 1. 当内存不够或者算法设计不好时,如果数据量达到一定规模以上,运行时间会急剧增加。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 31: 2. 现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 32: 1. 外存归并排序,以()为单位进行调度。
选项:
• A. 比特
• B. 兆
• C. 块
• D. 层
答案: 请关注公众号【大象答案】查看答案
问题 33: 1. 在外排序的快速排序中,分割元素的选择非常重要。
选项:
• A. 正确
• B. 错误
答案: 请关注公众号【大象答案】查看答案
问题 34: 1. 在内存中的二分搜索树中,通常使用()来维护树的平衡。()
选项:
• A. 置换
• B. 分裂
• C. 旋转
• D. 合并
答案: 请关注公众号【大象答案】查看答案
问题 35: 2. 二叉搜索树是在n个元素之间搜索的标准方法,一般把元素保存在根处。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 36: 1. 如果T是一个(a,b)-树(a≧2且b≧2a-1),其根结点的度在()之间。
选项:
• A. 2到a
• B. 2到b
• C. a到b
• D. 2到4
答案: 请关注公众号【大象答案】查看答案
问题 37: 2. 在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 38: 1. 元素都在叶子中的B-树有时被称为()。
选项:
• A. B+树
• B. B-+树
• C. B+-树
• D. B+-数
答案: 请关注公众号【大象答案】查看答案
问题 39: 2. 关于(a,b)—树的删除操作,删除操作出现问题的情形是:从叶子v删除元素后,v的儿子小于a-1个。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 40: 1. 对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。
选项:
• A. O (sort(N))
• B. O(scan(N))
• C. O(scan(N))IO
• D. IO(scan(N))
答案: 请关注公众号【大象答案】查看答案
问题 41: 2. 为数T的每个结点标上子树大小的I/O复杂度为()。
选项:
• A. IO (sort(N))
• B. O (sort(N))
• C. IO(scan(N))
• D. O(scan(N))
答案: 请关注公众号【大象答案】查看答案
问题 42: 3. 图中的独立集是指图当中点的集合,其任意两点之间不存在边。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 43: 4. 外存算法最坏情况的I/O数位Ω(N)。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 44: 1. 求最大独立集的基本思想是使用贪心法。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 45: 1. 图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。
选项:
• A. 自举
• B. 缩图法
• C. 时间前向处理
• D. 连通分量
答案: 请关注公众号【大象答案】查看答案
问题 46: 2. 在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 47: 3. 图的连通性算法可扩增为求图G最小生成树(MST)的算法。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 48: 1. MapReduce的执行框架处理的内容包括()。
选项:
• A. 调度
• B. 数据分布
• C. 将中间数据进行聚集、排序或洗牌
• D. 进行错误处理
答案: 请关注公众号【大象答案】查看答案
问题 49: 2. MapReduce是由()开发的分布式编程模型。
选项:
• A. Microsoft
• B. Google
• C. Tencent
• D. Alibaba Group
答案: 请关注公众号【大象答案】查看答案
问题 50: 3. 在实现MapReduce程序时,需要注意的事项不包括()。
选项:
• A. 避免创建对象
• B. 避免缓冲
• C. 避免通信
• D. 避免Mapper和Reducer间的全局变量传递
答案: 请关注公众号【大象答案】查看答案
问题 51: 4. Map()和Reduce()两个函数不能够并行运行。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 52: 1. 在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。
选项:
• A. 序列
• B. 基数
• C. 集合
答案: 请关注公众号【大象答案】查看答案
问题 53: 1. combiner的运行次数可能有多次。
选项:
答案: 请关注公众号【大象答案】查看答案
问题 54: 1. 用单词共现矩阵解决大规模计数问题的基本方法是()。
选项:
• A. Mapper生成部分计数
• B. Reducer生成部分计数
• C. Reducer聚合部分计数
• D. Mapper聚合部分计数
答案: 请关注公众号【大象答案】查看答案
问题 55: 2. 关于单词共现矩阵的计算,说法正确的是()。
选项:
• A. 计算文本集合中词的共现矩阵
• B. 词的个数如果为N,输出为M*N的矩阵
• C. 是一种测量语义距离的方法
• D. 语义距离可用于许多语言处理任务
答案: 请关注公众号【大象答案】查看答案
问题 56: 3. “条纹法”的优点有()。
选项:
• A. 易于实现
• B. 对key-value对的排序和洗牌少得多
• C. 潜在对象更大
• D. 能更好地利用combiner
答案: 请关注公众号【大象答案】查看答案
问题 57: 4. f(B|A)词对法必须确定所有a被传递到同一个combiner。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 58: 5. “词对法”的缺点是不易实现,排序和洗牌代价高。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 59: 1. 在基于路径的算法中,边的标记包括()。
选项:
• A. 代价
• B. 距离
• C. 相似性
• D. 属性
答案: 请关注公众号【大象答案】查看答案
问题 60: 2. 基于路径的算法的例子不包括()。
选项:
• A. 单源最短路径
• B. 最小生成树
• C. 分布式不动点运算
• D. 拓扑排序
答案: 请关注公众号【大象答案】查看答案
问题 61: 3. Dijkstra算法需要并行化。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 62: 1. 缓存迭代的方法是()。
选项:
• A. 在Mapper前加入输入缓存
• B. 在Mapper后加入输出缓存
• C. 在Reducer前加入输入缓存
• D. 在Reducer后加入输出缓存
答案: 请关注公众号【大象答案】查看答案
问题 63: 2. MapReduce是一种非递归描述性语言的通用运行平台。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 64: 1. 下列属于众包应用的例子有()。
选项:
• A. 验证码
• B. 机器翻译
• C. 图像搜索
• D. 数据库查询
答案: 请关注公众号【大象答案】查看答案
问题 65: 2. 目前众包技术已经可以判断两幅画在艺术风格上是否一致。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 66: 3. 众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 67: 1. 用机器完成众包的优势有()。
选项:
• A. 省钱
• B. 省时
• C. 数量大
• D. 质量高
答案: 请关注公众号【大象答案】查看答案
问题 68: 2. 基于簇的HIT生成问题的优化目标是生成最小数目基于簇的HIT。()
选项:
答案: 请关注公众号【大象答案】查看答案
问题 69: 3. 目前众包技术完全由计算机来完成。()
选项:
答案: 请关注公众号【大象答案】查看答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。