《数据挖掘知识竞赛题库及答案.docx》由会员分享,可在线阅读,更多相关《数据挖掘知识竞赛题库及答案.docx(17页珍藏版)》请在优知文库上搜索。
1、知识题库数据挖掘知识竞赛题库及答案1.什么是KDD?A、A.数据挖掘与知识发现B、B.领域知识发现C、C.文档知识发现D、D.动态知识发现答案:A2、数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。A:对B:错答案:对3、数据挖掘的预测建模任务主要包括哪几大类问题?数据挖掘的预测建模任务主要包括哪几大类问题?()A.分类B,回归C.模式发现D.模式匹配答案:AB4、以下哪些学科和数据挎掘有密切联系?A、统计B、计算机组成原理C、矿产挖掘D、人工智能答案:AD5、离群点可以是合法的数据对象或者值。答案:1、下面哪个属于定量的属性类型:在上题中,属于定量的属性
2、类型是:()A标称B序数C区间D相异答案:C2、只有非零值才重要的二元属性被称作:只有非零值才重要的二元属性被称作:()A.计数属性B.离散属性C.非对称的二元属性D.对称属性答案:C3、定量属性可以是整数值或者是连续值。答案:正确4、中心趋势度量模(mode)是指A、算术平均值B、数据集中出现频率最高的值C、最大值D、最小值答案:数据集中出现频率最高的值A、平均值B、标准差C、五数概括D、中位数答案:平均值中位数1、数据清洗的方法不包括A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理答案:D2、对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?A、频繁模式挖掘B、
3、分类和预测C、数据预处理D、噪声检测答案:数据预处理3、以下哪项不属于数据规约的方法?A、数据迁移B、维规约C、数据压缩D、数值规约答案:数据迁移4、大数据预处理的方法不包含以下哪个选项?A、数据清洗B、数据变换C、数据采集D、数据规约答案:数据采集5、在噪声数据中,波动数据比离群点数据偏离整体水平更大。答案:错1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?A、关联规则发现B、聚类C、分类D、自然语言处理答案:关联规则发现2、关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。答案:错3、具有较高的支持度的项集具有较高的置信度。A.正确B.
4、错误答案:错误4、给定关联规则AB,意味着:若A发生,B也会发生。答案:错5、啤酒与尿布的故事是聚类分析的典型实例。答案:错1、分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。正确错误答案:正确2、决策树方法通常用于关联规则挖掘。答案:错3、在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大这是出现了模型拟合不足的问题。答案:错4、对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。答案:5、下面哪种分类方法是属于统计学的分类方法?A、判定树归纳B、贝叶斯分类C、后向传播分类D、基于案例的推理答案:贝叶斯分类1、基于划分方法的聚类都是基于距离来判断数据对象相似度的答案:对2、K-MeanS聚类过程中计算出的质心点是虚拟的。答案:对3、DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目答案:错4、下列属于层次聚类方法的是A、K-MeansB、AGNESC、DIANAD、DBSCAN答案:AGNES;DIANA5、衡量离群点的离群因子,计算的是A、簇间距离B、轮廓系数C、平均绝对偏差D、簇间距离的加权平均值答案:簇间距离的加权平均值