《《数据资源管理》 习题及答案 第6--10章 数据分析与服务---数据资源管理机构.docx》由会员分享,可在线阅读,更多相关《《数据资源管理》 习题及答案 第6--10章 数据分析与服务---数据资源管理机构.docx(21页珍藏版)》请在优知文库上搜索。
1、数据资源管理配套习题第六章数据分析与服务一、单项选择题1.下列关于数据分析的说法错误的是()。A.数据融合将被存储的数据减少至可操作、可管理、有意义的数据量。B.数据分析包含数据清理、转换、建模、统计等操作,提取有用信息并形成结论。C.深度分析一般采用SQL查询语句对结构化数据进行多维度的聚集查询处理。D.对于细节层面信息的获取,数据分析缺乏如索引和访问控制等方面的技术。(答案:C;深度分析采用复杂度较高的数据挖掘和机错学习方法,可以处理结构化的和非结构化数据。参考:6.1.1数据分析定义)2 .下列关于数据可视化的说法错误的是()。A.企业的业务系统数据属于外部数据。B.数据可视化将抽象、冗
2、余甚至毫无联系的信息整合起来,并转换为图形、符号或者概念模型。C.数据可视化的流程闭环,从数据采集、数据清洗、数据库技术到可视化,再回到数据采集。D.数据采集的方式有传感器、爬虫、录入、导入、接口等。(答案:Ao参考:6.2.1数据可视化定义)3 .下列关于数据可视化方法的说法错误的是()。A.面积与尺寸可视化要用数学公式计算,来表达准确的尺度和比例。B.地域空间可视化以用地图为大背景,可以定位某一地区来查看详细数据。C.概念可视化将抽象的指标数据转换成用户熟悉的容易感知的数据。D.眼球热力图是图形可视化的一种应用。(答案:D:眼球热力图是颜色可视化的种应用。参考:6.2.3数据可视化方法)4
3、 .下列关于数据服务定义的说法错误的是()。A.数据服务通过网络实现数据的有效管理、精确访问、异构集成、相互共享、信息提取等功能。B.数据服务将数据管理平台、多数据源查询引擎和数据服务设计开发工具紧密联系起来。C.随着用户需求不断增加,数据服务的形式和内容呈现多样化趋势。D.数据服务对用户非唯一、非排他,降低了数据源的安全性。(答案:D:数据服务对用户具有唯性和排他性,大大增强了数据源本身的安全性。参考:6.3.1数据服务定义)5 .下列关于数据服务分类的说法错误的是()。A.企业的数据服务分为数据集服务和数据API服务两大类。B.基础数据服务面向的场景包括千人千面、画像分析等,通过实现数据中
4、台全域标签跨计算、统一查询分析,加快数据应用开发速度。C.智慧政府的工具类大数据服务利用产品化的工具产生或生产数据,面向应用的大数据服务针对已有的数据进行数据资源消费。D.智慧政府的工具类大数据服务包括元数据管理服务、数据仓库建模服务、数据共享交换服务等。(答案:B:B选项描述的是标签画像服务。参考:632数据服务分类)二、不定项选择题1.关于数据湖的数据分析,下列说法正确的是()。A.从数据湖获取的初始数据不能直接利用,需要进行数据融合。B.假设搜索是寻找搜索标准模糊的数据,相关技术有机器学习、概念检索等。C.数据缩减的技巧有消除重复数据、消除或修改异常值、数据压缩等。D.支持度、置信度和提
5、升度是对比分析常用的指标。E.上下文语义分析将文本数据转换成一致的数据库格式,并识别文本的语境。F.置信度是两种商品同时被购买的概率,或者某个商品组合的购买次数占总商品购买次数的比例。(答案:ACE:找搜索标准模糊的数据是针对数据分析两面性的检索;支持度、置信度和提升度是关联分析常用的指标;两种商品同时被购买的概率或者某个商品组合的购买次数占总商品购买次数的比例是指支持度。参考:”6.1.2数据湖的数据分析”、“6.1.3数据分析方法”分点1“关联分析”)2 .关于数据分析方法,下列说法正确的是()。A.A/Btest对用户流向进行监测,用来衡量网站优化的效果或营销推广的效果和了解用户行为偏好
6、。B.留存分析考查用户进行初始行为后的一段时间仍存在的客户行为,反映客户粘性以及产品对用户的吸引力。C.帕累托分析是在同一时间维度,将Web或APP界面或流程的两个或多个版本给类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。D.正常情况下,留存率会随着时间周期的推移逐渐提升。E.海盗模型从获客、激活、留存、变现、自传播五个节点分析转化率,从而找到能够提升的环节。F.象限法通过两种及以上的维度,运用坐标的方式对数据进行划分,从而将数据转变为策略。(答案:BEF;C选项描述的是路径分析;C选项描述的是A/Blesi;正常情况下,留存率会随着时间周期的推移而逐
7、渐降低。参考:6.1.3数据分析方法)3 .关于数据可视化流程,下列说法正确的是()。A.缺失值的处理方式有删除存在缺失值的个案或者插补缺失值。B.绘制箱形图需要上边缘、上四分位数、下四分位数、下边缘,不需要中位数。C.直方图使用条形的高度或长度来表示频数,并通过频数大小进行排序。D.编写数据库查询的SQL语句时,明确查询响应时间是关键。E.数据可视化页面初步开发制作完成后,需要增加预览环节,观察页面整体效果和可承载并发数。F.缺失值插补法有均值插补、多重插补法两种。(答案:ADE;绘制箱形图需要中位数;直方图是用面积表示表示频数:缺失值插补法包括均值插补、利用同类均值插补、极大似然估计、多重
8、插补法。参考:6.2.2数据可视化流程)4.关于数据自助服务,下列说法正确的是()。A.数据分析师基于业务领域对象之类的语义层进行分析,无需了解实际数据操作的复杂性。B.自助服务元数据工具允许分析人员自行注释、查找和理解数据集。C.数据自助服务需要IT人员参与才能部署和使用。D.数据仓库主要用于支持关键的生产报告和分析,而不是为处理大量即时查询和分析而设计的。E.数据湖中实现数据自助服务需要预处理数据,可能涉及组合、过滤、聚合、修复数据质量问题等。E企业中数据湖的目的之一是创建可以自助向数据仓库添加内容的环境。(答案:ABDEF:数据自助服务不需要IT人员参与就能部署和使用。参考:6.3.3数
9、据自助服务)5.关于数据预置,下列说法正确的是()。A.数据预置是指获得使用数据的权限。B.许多行业需要处理大量敏感数据,数据预置面临的一大挑战是决定哪些分析师可以访问哪些数据。C.企业通过创建元数据目录,使分析人员无需访问数据本身即可查找数据集。D.目录是一种访问控制方法,数据管理员或所有者决定是否授限和权限有效期。E.通过目录,分析人员可以在数据库中找到任何数据,但无法访问它。E目录可以授予特定时间段内的访问权限,但无法对数据集的一部分进行授权。(答案:BCDE:数据预置包含了获得使用数据的权限、物理地获取到数据两个方面;目录可以授予特定时间段内的访问权限以及对数据集的一部分进行授权。参考
10、:“633数据自助服务”分点3“数据预置”)三、填空题1 .对比方式分为横向对比、四种类型。(答案:纵向对比:目标对比;时间对比。参考:”6.1.3数据分析方法”分点2“对比分析”)2 .常见的象限法应用有模型、矩阵。(答案:RFM:波士顿。参考:”6.1.3数据分析方法”分点6“象限分析”)3 .数据服务体系的数据服务分为基础数据服务、三大类。(答案:标签画像服务;算法模型服务。参考:“6.3.2数据服务分类”分点2“数据服务体系”)4 .数据分析师对数据建立信任通常基于、三个维度。(答案:数据质量;血缘:管理员。参考:”6.3.3数据自助服务”分点2“建立信任”)5 .分析一般采用SQL查
11、询语句对结构化数据进行多维度的聚集查询处理。(答案:在线联机。参考:6.1.1数据分析定义)四、判断题1 .数据排序、数据摘要、数据比较、异常分析都是数据分析的不同形式。()(答案:o参考:6.1.2数据湖的数据分析)2 .数据集服务为IT系统提供数据事件驱动的响应和执行结果。()(答案:X:数据API服务为IT系统提供数据事件驱动的响应和执行结果。参考:”6.3.2数据服务分类”分点1“企业”)3 .关于企业数据的知识保存在部分人的头脑里,也就是“部落知识”,包括数据含义、数据在哪里以及什么情况下用哪个数据集。()(答案:o参考:”6.3.3数据自助服务”分点I发现和理解数据”)4 .可视化
12、技术通常以关系型格式获取、整理和展示数据。()(答案:o参考:”6.3.3数据自助服务”分点5分析和可视化”)5 .横向对比是对同一层级不同对象的比较,比如某市在2022年各月份的茅台销量。()(答案:X:某市在2022年各月份的茅台销量属于纵向对比。参考:”6.1.3数据分析方法”分点2“对比分析”)第7章数据管理一、单项选择题1.下列关于元数据定义的说法错误的是()。A.元数据又叫“描述数据”,是对数据内容的描述,是关于数据的数据。B.传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都属于元数据。C.计算机领域的管理元数据是应用系统的辅助信息,帮助用户查询信息、理解信息。D.地理学领域的
13、元数据已经基本实现了标准化。(答案:C:应用系统的辅助信息是用户元数据。参考:“7.Ll元数据定义与作用”分点1、2)2 .下列关于元数据标准的说法错误的是()。A.元数据标准是描述某类资源的具体对象时所有规则的集合,分为语义、结构、句法三个层次。B.机读编目格式标准是国际公认的用于确定最小信息资源描述的元数据格式。C.VRA是美国视觉资源协会数据标准委员会开发的核心类目录标准,用在网络环境中描述建筑、艺术等视频。DCDWA主要用于建筑、艺术品和其他文化资源。(答案:B:国际公认的用于确定最小信息资源描述的元数据格式是都柏林核心元数据。参考:7.2.3元数据标准)3 .下列关于元数据维护的说法
14、错误的是()。A.元数据维护是对信息对象的基本信息、属性、被依赖关系、依赖关系、组合关系等元数据的新增、修改、删除、查询、发布等操作。B.已经发布上线的元数据可以进行直接修改来调整、优化。C.数据仓库最根本的特点是物理地存放数据,且这些数据是来源于其他数据库的。D.当数据仓库的数据源运行环境、结构及目标数据的维护计划发生变化时,需要修改元数据。(答案:B;已经发布上线的元数据如需调整、优化,必须重新走元数据发布流程,不允许进行直接修改。参考:7.3.2元数据维护)4 .下列关于元数据查询的说法错误的是()。A.基于语义的元数据索引查询方法以树为数据模型,能应用于复杂的语义网络。B.本体和元数据
15、都能用来描述某一范围内的资源,这种本体称为领域本体,这种元数据称为元数据标准。C.大多数采用元数据组织信息的系统使用关键字匹配的查询方法,使同义不同形的词在查询时被漏掉,造成查全率不高。D.基于XML语言的元数据索引查询方法缺乏语义描述,因而难以应用于语义Web环境的智能处理。(答案:A:基于语义的元数据索引查询方法无法应用于复杂的语义网络。参考:7.3.3元数据查询)5 .下列关于血缘分析的说法错误的是()。A.血缘分析通过梳理系统、表、视图、字段等之间的关系,采用有向无环图进行可视化展现。B.血缘分析广泛应用于异常定位、监管报送、质量检验、数据价值评估等场景。C.数据的血缘关系有集群血缘、系统血缘、表级血缘和字段血缘等,指向了数据的上游来源,向上游追根溯源。D.血缘分析中的自动解析方法效率最高,是根据一定规则,在数据加工流转过程中直接由加工主体完成血缘关系的映射。(答案:D:D选项描述的是系统跟踪方法。参考:”7.3.4元数据分析”分点1各类型元数据分析”)二、不定项选择题1.关于元数据的作用,下列说法正确的是()。A.元数据对数据对象的内容和属性进行描述,这是各组织、各部门之间达成共识的基础。B.元数据将信息对象