国家开放大学|国开搜题

广东开放大学形成性考核答案数据分析与挖掘（本专）作业答案

来源：百年教育职业培训中心　更新时间：2024-11-23 03:02:18

2024秋最新广东开放大学《数据分析与挖掘（本专）》形考作业试题题库、期末题库及答案考试说明:本人针对该科精心汇总了历年题库及答案，形成一个完整的题库，并且每年都在更新。该题库对考生的复习、作业和考试

2024秋最新广东开放大学《数据分析与挖掘（本专）》形考作业试题题库、期末题库及答案

考试说明:本人针对该科精心汇总了历年题库及答案，形成一个完整的题库，并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用，会给您节省大量的时间。做考题时，利用本文档中的查找工具，把考题中的关键字输到查找工具的查找内容框内，就可迅速查找到该题答案。本文库超星学习通、知到智慧树、国家开放大学、广东开放大学、江苏开放大学、上海开放大学、云南开放大学、芯位教育、云慕学苑、职教云、川农在线、长江雨课堂、安徽继续教育平台、青书学堂、睿学在线、成教云、京人平台、绎通继教云、学起Plus、云上河开、河南继续教育、四川开放大学、良师在线、继教云、日照专业技术人员继续教育、麦能网、21tb、168网校、云班课、电大中专、learnin、西财在线等平台复习试题与答案，敬请查看。

课程题目试题是随机的，请按题目关键词查找（或按Ctrl+F输入题目中的关键词，尽量不要输入整个题目，不要复制空格，连续的几个字就行）

本文由【广开搜题】微信公众号提供，禁止复制盗取，违者必究

本文由【广开搜题】微信公众号提供，禁止复制盗取，违者必究

本文由【广开搜题】微信公众号提供，禁止复制盗取，违者必究

数据分析与挖掘（本专）

学校: 无

问题 1: 1. 标志是说明总体单位属性和特征的名称，统计指标是说明总体特征的。

选项:

答案: 正确

问题 2: 2. 统计调查时,调查单位和填报单位总是一致的。

选项:

答案: 错误

问题 3: 1. 在Python中，可以使用range

选项:

答案: 正确

问题 4: 2. 在Python中，使用def 保留字，可以删除列表中的元素( )

选项:

答案: 错误

问题 5: 1. 折线图比较适合描述和比较多组数据随时间变化的趋势，或者一组数据对另外一组数据的依赖程度。

选项:

答案: 正确

问题 6: 2. 绘制图形时触发事件button_release_event

选项:

答案: 错误

问题 7: 1. 下列常用的数据分析与挖掘工具中，属于商业软件的是？（）

选项:

• A. SPSS

• B. Python

• C. R语言

• D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 8: 2. 对于假设检验，下列说法正确的是：（）

选项:

• A. 以结构风险最小为原则

• B. 主要用于分类问题的归类等

• C. 知识和结果的不可解释性

• D. 基于小概率事件原理

答案: 请关注公众号【广开搜题】查看答案

问题 9: 3. 下列关于贝叶斯定理描述错误的是：（）

选项:

• A. 主要用于分类问题的归类等

• B. 主要用来确定群组内部和群租间的相似度和相异度

• C. 一种非常成熟的统计学分类方法

• D. 朴素贝叶斯分类方法可以跟决策树和神经网络算法相媲美。

答案: 请关注公众号【广开搜题】查看答案

问题 10: 4. 2008年，谷歌发布了“谷歌流感趋势”地图，利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术？（）

选项:

• A. 神经网络

• B. 回归分析

• C. 假设检验

• D. 决策树

答案: 请关注公众号【广开搜题】查看答案

问题 11: 5. 下列不是对决策树CHAID算法的描述的选项是？（）

选项:

• A. SQL)

• B. CART

• C. CHAID

• D. ID3

答案: 请关注公众号【广开搜题】查看答案

问题 12: 6. 不属于Python语言代码特点的是：（）

选项:

• A. 易维护性

• B. 简洁性

• C. 不可移植性

• D. 易读性

答案: 请关注公众号【广开搜题】查看答案

问题 13: 7. 下列对决策树ID3算法的描述不正确的选项是？（）

选项:

• A. 基于信息熵来选择最佳测试属性

• B. 根据信息论理论，采用划分后样本集的不确定性作为衡量划分好坏的标准，用信息增益值度量不确定性

• C. 利用卡方检验来选择对因变量最有影响的自变量

• D. 样本集的划分依据测试属性的取值进行

答案: 请关注公众号【广开搜题】查看答案

问题 14: 8. 在回归分析中，下列哪个选项不属于线性回归（）

选项:

• A. 分段回归

• B. 一元线性回归

• C. 多个因变量与多个自变量的回归

• D. 多元线性回归

答案: 请关注公众号【广开搜题】查看答案

问题 15: 9. 在回归分析中，不属于参数估计方法改进方向的选项是？（）

选项:

• A. 偏最小二乘回归

• B. 主成分回归

• C. 岭回归

• D. 非线性回归

答案: 请关注公众号【广开搜题】查看答案

问题 16: 10. 关于神经网络，描述错误的选项是？（）

选项:

• A. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联

• B. 大规模串行结构和信息的串行处理

• C. 主流的神经网络算法是反馈传播，该算法在多层前向型神经网络上进行学习

• D. 知识和结果的不可解释性

答案: 请关注公众号【广开搜题】查看答案

问题 17: 11. 通常情况下，神经网络不会应用在下列哪个领域？（）

选项:

• A. 预测系统

• B. 统计分析

• C. 信号处理

• D. 模式识别

答案: 请关注公众号【广开搜题】查看答案

问题 18: 12. 关于支持向量机，下列说法正确的选项是？（）

选项:

• A. 知识和结果的不可解释性

• B. 对于复杂的非线性的决策边界的建模能力高度准确，并且也不太容易过拟合

• C. 大规模串行结构和信息的串行处理

• D. 通过输入多个非线性模型以及不同模型之间的加权互联

答案: 请关注公众号【广开搜题】查看答案

问题 19: 13. 如果我们要给餐饮业做数据分析和挖掘，那么在整个实际流程中，下列哪个步骤是耗时最长的？（）

选项:

• A. 应用部署

• B. 模型构建与评估

• C. 明确数据挖掘目标

• D. 数据收集与清洗

答案: 请关注公众号【广开搜题】查看答案

问题 20: 14. 下列选项中，不是对支持向量机的描述的是？（）

选项:

• A. 在线性的情况下，就在原空间寻找两类样本的最优分类超平面

• B. 以结构风险最小为原则

• C. 训练数据较大

• D. 基于小概率事件原理

答案: 请关注公众号【广开搜题】查看答案

问题 21: 15. 采用假设检验的方法观测事件并下结论（在一定的显著性水平下得出的）时，有可能会给出错误判断。下列描述不正确的是？（）

选项:

• A. 当原假设为真时，却否定它而犯的错误，即拒绝正确假设的错误，也叫弃真错误,通常也叫α错误

• B. α错误和β错误在其他条件不变的情况下是相反的，即α增大时，β就减小；α减小时，β就增大。α错误容易受数据分析人员的控制

• C. 当原假设为假时，却肯定它而犯的错误，即接受错误假设的错误，也叫纳伪错误，通常也叫β错误

• D. α错误和β错误在其他条件不变的情况下是一致的，即α增大时，β就增大；α减小时，β就减小。α错误容易受数据分析人员的控制

答案: 请关注公众号【广开搜题】查看答案

问题 22: 16. 从狭义角度来说，数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述？（）

选项:

• A. 数据分析更重视结合业务知识解读统计结果

• B. 数据分析需要有过硬的数学功底和编程技术

• C. 数据分析更重视模型或规则的构建

• D. 数据分析是技术性的“采矿”过程，发现未知的模式和规律

答案: 请关注公众号【广开搜题】查看答案

问题 23: 17. 下列常用的数据分析与挖掘工具中，不属于开源工具的是？（）

选项:

• A. SPSS

• B. R语言

• C. Weka

• D. Python

答案: 请关注公众号【广开搜题】查看答案

问题 24: 18. 下列对数据挖掘的描述不正确的选项是？（）

选项:

• A. 贝叶斯分类方法（Bayesian Classifier）是非常成熟的统计学分类方法，它主要用来预测类成员间关系的可能性。

• B. 神经网络（Neural Network）是通过数学算法来模仿人脑思维的抽象计算模型，它是数据挖掘中机器学习的典型代表。

• C. 回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具.

• D. 关联规则经过划分后，每个群组内部各对象间的相似度会很高，而在不同群组之间的对象彼此间将具有很高的相异度。

答案: 请关注公众号【广开搜题】查看答案

问题 25: 19. 下列不是对决策树CHAID算法的描述的选项是？（）

选项:

• A. 检验标准是基尼系数（Gini）等不纯度的指标

• B. 应用的前提是因变量为类别型变量（Category）

• C. 利用卡方检验来选择对因变量最有影响的自变量

• D. 依据局部最优原则

答案: 请关注公众号【广开搜题】查看答案

问题 26: 20. 有一天，老师问了个问题，只根据头发和声音怎么判断一位同学的性别。为了解决这个问题，同学们马上简单的统计了7位同学的相关特征数据。那么请问，要解决老师的问题，采用哪种数据挖掘方法最合适？（）

选项:

• A. 聚类分析

• B. 假设检验

• C. 决策树

• D. 神经网络

答案: 请关注公众号【广开搜题】查看答案

问题 27: 21. 数据挖掘流程的操作步骤中，不包括以下哪种？（）

选项:

• A. 构建模型

• B. 绘制表格

• C. 应用部署

• D. 模型评估

答案: 请关注公众号【广开搜题】查看答案

问题 28: 22. 从狭义角度来说，数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述？（）

选项:

• A. 数据挖掘是技术性的“采矿”过程，发现未知的模式和规律

• B. 数据挖掘需要有过硬的数学功底和编程技术

• C. 数据挖掘更重视模型或规则的构建

• D. 数据挖掘侧重于实际的业务知识

答案: 请关注公众号【广开搜题】查看答案

问题 29: 23. 下列描述中，不属于神经网络的特点的是？（）

选项:

• A. 大规模并行结构和信息的并行处理

• B. 完美的知识和结果的解释性

• C. 良好的自适应性、自组织性和高容错性

• D. 较强的学习、记忆和识别功能

答案: 请关注公众号【广开搜题】查看答案

问题 30: 24. 2016年，Alphago以4比1击败了围棋世界冠军李世石。您认为，Alphago的能力成长主要运用了下列哪项技术？（）

选项:

• A. 决策树

• B. 支持向量机

• C. 神经网络

• D. 假设检验

答案: 请关注公众号【广开搜题】查看答案

问题 31: 25. 从狭义角度来说，数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是？（）

选项:

• A. 数据分析侧重于实际的业务知识

• B. 数据分析属于描述和探索性分析，评估现状和修正不足

• C. 数据分析需要有过硬的数学功底和编程技术

• D. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能

答案: 请关注公众号【广开搜题】查看答案

问题 32: 26. 数据挖掘流程的操作步骤有几种？（）

选项:

• A. 构建模型

• B. 应用部署

• C. 模型评估

• D. 数据清洗

答案: 请关注公众号【广开搜题】查看答案

问题 33: 27. 免费的数据分析与挖掘工具有下列哪几种：（）

选项:

• A. R语言

• B. Weka

• C. Python

• D. SPSS

答案: 请关注公众号【广开搜题】查看答案

问题 34: 28. 相对于数据分析来说，数据挖掘需要掌握的技能有：（）

选项:

• A. 良好的数学功底

• B. 基本的统计学知识

• C. 优秀的编程能力

• D. 常用可视化图表展现的能力

答案: 请关注公众号【广开搜题】查看答案

问题 35: 29. 下列不属于数据挖掘技术的有：（）

选项:

• A. PowerBI

• B. SQL

• C. 假设检验

• D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 36: 30. 下面选项中，属于列表的方法的是（）。

选项:

• A. PowerBI

• B. 假设检验

• C. Weka

• D. 贝叶斯定理

答案: 请关注公众号【广开搜题】查看答案

问题 37: 31. 属于数据分析与数据挖掘工具的有：（）

选项:

• A. R语言

• B. Python

• C. SQL

• D. Weka

答案: 请关注公众号【广开搜题】查看答案

问题 38: 32. 下列属于数据挖掘技术的有：（）

选项:

• A. 神经网络

• B. 决策树

• C. 关联规则

• D. 回归分析

答案: 请关注公众号【广开搜题】查看答案

问题 39: 33. 下列属于数据挖掘技术的有：（）

选项:

• A. 神经网络

• B. SPSS

• C. 支持向量机

• D. 决策树

答案: 请关注公众号【广开搜题】查看答案

问题 40: 34. 下列选项中，属于数据挖掘的成熟技术的是：（）

选项:

• A. 神经网络

• B. 支持向量机

• C. 决策树

• D. 聚类方法

答案: 请关注公众号【广开搜题】查看答案

问题 41: 35. 相对于数据分析来说，数据挖掘更加侧重于哪些层面：（）

选项:

• A. 实际的业务知识

• B. 技术的实现

• C. 运用技术手段从海量的数据中发现未知的模式和规律

• D. 将数据和业务紧密结合，实现功效的最大化

答案: 请关注公众号【广开搜题】查看答案

问题 42: 36. 下列选项中，不是对支持向量机的描述的是？（）

选项:

• A. 以结构风险最小为原则

• B. 在线性的情况下，就在原空间寻找两类样本的最优分类超平面

• C. 对于复杂的非线性的决策边界的建模能力高度准确，并且也不太容易过拟合

• D. 训练数据较小

答案: 请关注公众号【广开搜题】查看答案

问题 43: 37. 沃尔玛超市中“啤酒和尿不湿”的营销案例，属于哪种数据挖掘技术的经典应用？（）

选项:

• A. 决策树

• B. 神经网络

• C. 关联规则

• D. 聚类分析

答案: 请关注公众号【广开搜题】查看答案

问题 44: 38. 不属于数据分析与数据挖掘工具的有：（）

选项:

• A. SPSS

• B. Python

• C. R语言

• D. SQL

答案: 请关注公众号【广开搜题】查看答案

问题 45: 39. 下列关于聚类分析不正确的说法是：（）

选项:

• A. 运用层次的方法，依次让最相似的数据对象两两合并，这样不断地合并，最后就形成了一棵聚类树

• B. 按照相似性和相异性进行划分后，每个群组内部各对象间的相似度会很高，而不同群组对象之间的相异度很低

• C. 直接作为模型对观察对象进行群体划分

• D. 数据处理阶段用作数据探索的工具，通过聚类发现数据间的深层次的关系等

答案: 请关注公众号【广开搜题】查看答案

问题 46: 40. Python语言是荷兰人Guido van Rossum发明的，首次公开发行的年份是哪一年?（）

选项:

• A. 1991年

• B. 1989年

• C. 1996年

• D. 1993年

答案: 请关注公众号【广开搜题】查看答案

问题 47: 41. 决策树技术对数据的分布甚至缺失非常宽容，不容易受到极值的影响。（）

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 48: 42. 关联规则数据挖掘的主要目的是找出数据集中同时出现的关系（）

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 49: 43. 目前，最常用的3种决策树算法分别是CHAID、CART和ID3。（）

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 50: 44. 从广义角度来说，数据分析和数据挖掘包含的范畴是一致的。（）

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 51: 45. 神经网络对于复杂的非线性的决策边界的建模能力高度准确，并且也不太容易过拟合。（）

选项:

答案: 请关注公众号【广开搜题】查看答案

问题 52: 46. 支持度和关联度是衡量关联规则强度的两个重要指标（）

选项:

答案: 请关注公众号【广开搜题】查看答案

广东开放大学形成性考核答案数据分析与挖掘（本专）作业答案

来源：百年教育职业培训中心 更新时间：2024-11-23 03:02:18

来源：百年教育职业培训中心　更新时间：2024-11-23 03:02:18