
大数据算法
学校: 无
问题: 1. 大数据的应用包括()。
选项:
• A. 预测
• B. 推荐
• C. 商业情报分析
• D. 科学研究
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 以下选项中,大数据涉及的领域中包括()。
选项:
• A. 社交网络
• B. 医疗数据
• C. 计算机艺术
• D. 医疗数据
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 在《法华经》中,“那由他”描写的“大”的数量级是()。
选项:
• A. 10^7
• B. 10^14
• C. 10^28
• D. 10^56
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 5. 目前,关于大数据已有公认的确定定义。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 大数据求解计算问题过程的第三步一般是()。
选项:
• A. 判断可计www.yuyue-edu.cn算否
• B. 判断能行可计算否
• C. 算法设计与分析
• D. 用计算机语言实现算法
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 大数据求解计算问题过程的第一步是确定该问题是否可计算。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题:云南开放大学答案 1. 大数据算法可以不是()。
选项:
• A. 云计算
• B. 精确算法
• C. 内存算法
• D. 串行算法
答案:上海开放大学答案 请关注公众号【渝粤搜题】查看答案
问题: 2. 资源约束包括()。
选项:
• A. CPU
• B. 网络带宽
• C. 内存
• D. 外存
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 大数据算法涉及到外存的时候,通常要分析()。
选项:
• A. 时间空间复杂性
• B. IO复杂性
• C. 结果质量
• D. 通讯复杂性
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 对于数据流算法或在线算法,经常要分析结果的近似比。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 在线算法/数据流算法是面向大数据速度快的特点提出的。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 亚线性是指()等的消耗是输入规模o。()
选项:
• A. 时间
• B. 空间
• C. IO
• D. 通讯
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 性质检测算法属于亚线性空间算法的一类。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 水库抽样算法的采样是均匀的。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 采用平面图的直径近似算法的动机是无法在要求的时间内得到()。
选项:
• A. 相似解
• B. 完整解
• C. 精确解
• D. 近似解
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。
选项:
• A. 二分之一
• B. 三分之一
• C. 四分之一
• D. 十分之一
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 近似算法能给出一个优化问题的优化解。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 5. Ratio Bound越大,则近似解越坏。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 在判定问题的近似中,对于近似解需要区分的是()。
选项:
• A. 是
• B. 否
• C. 差不离
• D. 差得很远
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
选江苏开放大学答案项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 频繁元素计算算法又称为()算法。
选项:
• A. MM
• B. MG
• C. GM
• D. MP
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 频繁元素计算算法有效的原因是源于()。
选项:
• A. 取近似解
• B. 证据引理
• C. 错误界限和k成反比
• D. Zipf原则
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。
选项:
• A. 近似值
• B. 精确值
• C. 权重
• D. 界限
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 对联通分量个数的估计可以利用随机化方法。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 下列选项中叙述正确的是()。
选项:
• A. 磁盘的访问可以随机读、随机取
• B. 磁盘系统传输大规模连续的数据块的范围是18-32k
• C. 磁盘访问比主存访问的速度快
• D. 大多数程序在RAM模型上运行
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 当内存不够或者算法设计不好时,如果数据量达到一定规模以上,运行时间会急剧增加。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 排序分为内部排序和外部排序,外部排序是因排序的数据很大,一次不能容纳全部的排序内容,在排序过程中需要访问外存。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 在外排序的快速排序中,分割元素的选择非常重要。
选项:
• A. 正确
• B. 错误
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 在内存中的二分搜索树中,通常使用()来维护树的平衡。()
选项:
• A. 置换
• B. 分裂
• C. 旋转
• D. 合并
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 二叉搜索树是在n个元素之间搜索的标准方法,一般把元素保存在根处。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 如果T是一个(a,b)-树(a≧2且b≧2a-1),其根结点的度在()之间。
选项:
• A. 2到a
• 北京开放大学答案B. 2到b
• C. a到b
• D. 2到4
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 关于(a,b)-树的插入,插入涉及到的结点最多到树高+1。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 构建KDB-树时,完成网格建立之后,计算每个网格中点的个数,并且存储在()中。
选项:
• A. 外存
• B. 数据库
• C. 寄存器
• D. 内存
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. KD树在()层使用水平线。
选项:
• A. 偶数层
• B. 奇数层
• C. 最底层
• D. 最高层
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. KD树可以看成是两个二叉树的交叠。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 基于位置的查找实际上是一种三维空间的查找。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 前序计数的I/O复杂度为()。
选项:
• A. IO (sort(N))
• B. O (sort(N))
• C. IO(scan(N))
• D. O(scan(N))
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 为数T的每个结点标上子树大小的I/O复杂度为()渝粤题库。
选项:
• A. IO (sort(N))
• B. O (sort(N))
• C. IO(scan(N))
• D. O(scan(N))
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 图中的独立集是指图当中点的集合,其任意两点之间不存在边。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. 外存算法最坏情况的I/O数位Ω(N)。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 时间前向的处理方法是按照()来访问边。
选项:
• A. 欧拉回路
• B. 表排序
• C. 拓扑序
• D. 结点序
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 查找规模为N的表L中,每个独立集(MIS)的大小至少为()。
选项:
• A. n+1
• B. 2n
• C. n/2
• D. n/3
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 半外存算法是假设()。
选项:
• A. 边放在内存中,顶点在外面
• B. 顶点放在内存中,边在外面
• C. 顶点和边都放在内存当中
• D. 顶点和边都不在内存当中
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 图的连通性算法可扩增为求图G最小生成树(MST)的算法。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. MapReduce的执行框架处理的内容包括()。
选项:
• A. 调度
• B. 数据分布
• C. 将中间数据进行聚集、排序或洗牌
• D. 进行错误处理
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 在实现MapReduce程序时,需要注意的事项不包括()。
选项:
• A. 避免创建对象
• B. 避免缓冲
• C. 避免通信
• D. 避免Mapper和Reducer间的全局变量传递
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. MapReduce是由()开发的分布式编程模型。
选项:
• A. Microsoft
• B. Goo渝粤教育gle
• C. Tencent
• D. Alibaba Group
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. Map()和Reduce()两个函数不能够并行运行。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。
选项:
• A. 序列
• B. 基数
• C. 集合
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. combiner的运行次数可能有多次。
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. “条纹法”的优点有()。
选项:
• A. 易于实现
• B. 对key-value对的排序和洗牌少得多
• C. 潜在对象更大
• D. 能更好地利用combiner
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 关于单词共现矩阵的计算,说法正确的是()。
选项:
• A. 计算文本集合中词的共现矩阵
• B. 词的个数如果为N,输出为M*N的矩阵
• C. 是一种测量语义距离的方法
• D. 语义距离可用于许多语言处理任务
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 用单词共现矩阵解决大规模计数问题的基本方法是()。
选项:
• A. Mapper生成部分计数
• B. Reducer生成部分计数
• C. Reducer聚合部分计数
• D. Mapper聚合部分计数
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. f(B|A)词对法必须确定所有a被传递到同一个combiner。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 5. “词对法”的缺点是不易实现,排序和洗牌代价高。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. “推荐好友”是图算法在社交网络中的一种实际用例。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 在基于路径的算法中,边的标记包括()。
选项:
• A. 代价
• B. 距离
• C. 相似性
• D国家开放大学答案. 属性
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 基于路径的算法的例子不包括()。
选项:
• A. 单源最短路径
• B. 最小生成树
• C. 分布式不动点运算
• D. 拓扑排序
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。
选项:
• A. 边
• B. 顶点
• C. 结点
• D. 最小生成树
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 用Pregel计算子图同构问题,其三个步骤是()。
选项:
• A. 查询分解
• B. 搜索
• C. 迭代
• D. Join
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. Pregel系统中Master的作用不包括()。
选项:
• A. 维护worker
• B. 恢复workers产生的错误
• C. 提供Web-UI监督工作进程工具
• D. 与worker交流
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 关于并行节点计算,下列选项中关于节点叙述不准确的是()。
选项:
• A. 每一个节点接受上一个superstep发出的消息
• B. 执行相同的用户定义函数
• C. 所有节点根据用户定义函数修改它的值
• D. 没有额外工作要做时继续迭代
答案: 请关注公众号【渝粤搜题】查看答案
问题: 4. Pregel的编程形式,在执行计算的机器上每一阶段都利用整个图的全部状态。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 众包通过一系列的机制和方法来指导和协调()的行为,从而达到目的。
选项:
• A.渝粤搜题 个人
• B. 计算机
• C. 群体
• D. 软件
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. Wikipedia是众包案例的一种最成功的应用之一。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 外包与众包的区别在于众包的参与者数量大且不固定的。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 下列属于众包应用的例子有()。
选项:
• A. 验证码
• B. 机器翻译
• C. 图像搜索
• D. 数据库查询
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 目前众包技术已经可以判断两幅画在艺术风格上是否一致。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 用机器完成众包的优势有()。
选项:
• A. 省钱
• B. 省时
• C. 数量大
• D. 质量高
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. 基于簇的HIT生成问题的优化目标是生成最小数目基于簇的HIT。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 3. 目前众包技术完全由计算机来完成。()
广东开放大学答案选项:
答案: 请关注公众号【渝粤搜题】查看答案
问题: 1. 缓存迭代的方法是()。
选项:
• A. 在Mapper前加入输入缓存
• B. 在Mapper后加入输出缓存
• C. 在Reducer前加入输入缓存
• D. 在Reducer后加入输出缓存
答案: 请关注公众号【渝粤搜题】查看答案
问题: 2. MapReduce是一种非递归描述性语言的通用运行平台。()
选项:
答案: 请关注公众号【渝粤搜题】查看答案
微信扫码添加好友
如二维码无法识别,可拨打 13662661040 咨询。