《大数据技术与管理决策练习题及答案合集.docx》由会员分享,可在线阅读,更多相关《大数据技术与管理决策练习题及答案合集.docx(66页珍藏版)》请在优知文库上搜索。
1、1 .(填空)大数据的发展历程总体上可以划分为4个重要阶段。它们分别是?答案:萌芽期、突破期、成熟期和大规模应用期2 .(填空)按数据结构的不同,数据分为?答案:结构化数据、非结构化数据、半结构化数据3 .(填空)按照数据开发应用深入程度不同,可将大数据应用分为?答案:描述性分析应用、预测性分析应用和指导性分析应用4 .(填空)决策的5大特性包括?答案:目的性、选择性、满意性、过程性、动5 .(填空)决策过程的4个阶段为?答案:情报、设计、选择、执行6 .(判断)按决策影响范围和重要程度不同,管理决策分为战略决策、战术决策和业务决策A.B.答案:A7 .(判断)常见的定性决策方法有:头脑风暴法
2、、专家会议法、后悔值决策法、波士顿矩阵A.B.答案:B8.(判断)大数据对决策思维的影响主要体现在:全样而非抽样、精确而非高效,因果性而非相关性。A.B.答案:B9 .(判断)大数据应用已成熟,目前多应用于决策指导性分析。A.B.答案:B10 .(判断)从业务角度出发,大数据的核心价值主要有:数据辅助决策、数据驱动业务、数据对外变现。A.B.答案:A11 .(多选)根据大数据从来源到应用的流程,下列属于大数据技术架构的是:A.数据采集层B.数据抽取层C.数据分析层D.数据应用层答案:ACD12.(多选)大数据时代,现代企业的管理和发展面临哪些挑战?A.更多的数据被收集B.数据更加复杂C.决策自
3、动化D.实时决策需求突出答案:ABCD13.(多选)下列属于大数据“5V”特征的是:A.数据容量大B.数据类型多样C.数据价值密度高D.数据流转速度快答案:ABD14.(多选)按照载体不同,下列不属于文本数据的是:A.txt文本B.照片C.excel电子表格D.录像答案:BD15.(多选)下列关于数据、信息、知识的描述正确的是:A.信息是有意义、有用途的数据B.数据源于信息,是信息的表现形式和载体C.知识是更加系统化、理论化的信息D.从信息到数据再到知识,是螺旋式上升的过程答案:AC16.(判断)决策的基本流程包含发现并界定问题、确定决策目标、拟定备选方案、评价备选方案、选择方案和回馈评估方案
4、六大步。A.B.答案:A17 .(多选)以下哪些方法属于定性决策方法?A.头脑风暴法B.专家会议法C.乐观决策法D.波士顿矩阵法答案:ABD18 .(填空)大数据的五大特征包括?答案:1.数据容量大;2.数据类型多样;3.数据价值密度低;4.数据流转速度快;5.对数据真实性要求高L(单选)数据采集与处理工作不包括A.数据治理B数据获取C数据预处理D数据存储答案:A2 .(单选)以下哪项不属于大数据分析的范畴A.描述性分析B诊断分析C预测分析D聚类分析答案:D3 .(单选)大数据建模的步骤为A.模型建立-模型评估-模型训练-模型应用B模型建立-模型优化-模型训练模型应用C模型建立-模型训练-模型
5、评估-模型应用D模型建立-模型训练-模型优化-模型应用答案:C4 .(单选)决策数据可视化技术不包括A.海量数据可视化B文本数据可视化C网络可视化D多维数据可视化答案:A5 .(单选)大数据处理的核心环节是A.数据分析与挖掘B数据采集与处理C结果展示D数据应用答案:A6 .(判断)大数据决策是以信息技术、云计算技术、大数据技术等为支撑,以海量数据为主要驱动,通过大数据分析提出问题、确立目标、设计和选择方案的过程。A.B.答案:A7 .(判断)在数据状态上,大数据分析多使用存量数据,而大数据挖掘多使用动态增量数据或存量数据。A.B.8 .(判断)常见的决策数据采集技术包括网络数据采集、系统日志采
6、集、感知设备采集、数据库采集四种。A.B.答案:A9 .(判断)针对结构化和非结构化混合数据一般采用数据库集群的方式进行存储A.B.答案:B10 .(判断)HadOoP是一个分布式的、容错的实时计算系统,能够对实时动态的多源异构数据进行实时计算,获得有价值的信息。A.B.答案:B11 .(判断)数据分析与挖掘是大数据处理的核心环节,指通过数据标签服务、文本处理和影像组学分析等应用支撑,进行大数据的探索分析、模型拟合、模型训练及评估。A.B.答案:A第三单元测试题1 .(多选)M叩RedUCe体系结构主要由哪几个部分组成A.ClientB.JobTrackerC.TaskTrackerD.Tas
7、k答案:ABCD2 .(单选)以下名词解释不正确的是A.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTabIe的开源实现B.HDFS:分布式文件系统,是HadoOP项目的两大核心之一,是谷歌GFS的开源实现C. Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统D. Hive:一个基于HadOoP的数据仓库工具,用于对HadOoP文件中的数据集进行数据整理、特殊查询和分析存储答案:A3.(单选)HDFSFederatiOn设计不能解决“单名称节点”存在的哪个问题A,单点故障问题B.良好的隔离性C.性能更高效D.HDFS集群扩展性答案:A4.(
8、单选)下列说法正确的是A.第二名称节点无法解决单点故障问题B.HDFSHA提供高可用性,可以实现可扩展性、系统性能和隔离性C.第二名称节点是热备份D.HDFSHA可用性不好答案:A5.(多选)对新一代资源管理调度框架YARN的理解正确的是A.YARN的体系结构包含三个组件:ResourceManager,NodeManager,APPIiCatiOnMaSterB.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架C. MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务D. YARN既是资源管理调度框架,
9、也是一个计算框架答案:ABC6 .(判断)HadOOP支持数据的随机写。A.B.答案:B7 .(判断)HadoOP是JaVa开发的,所以HadooP只支持JaVa语言编写。A.8 .答案:B8 .(判断)HadOoPLo和2.0都具有完善的HDFSHA策略。A.B.答案:B9 .(判断)因为HadoOP有多个副本,所以NameNode不存在单点问题。A.B.答案:B10 .(判断)PlG是脚本语言,它与MaPRedUCe无关。A.B.答案:B11 .(单选)关于SeCOndaryNameNode哪项是正确的?A.它的目的是帮助NameNOde合并编辑日志,减少NameNode的启动时间B.它是
10、NameNode的热备份C.它对内存没有要求D.SecondaryNameNode应与NameNOde部署到一个节点答案:A12 .(填空)YARN的体系结构包括哪些组件?答案:ResourceManager、ApplicationMasterNodeManager13 .(单选)下面哪个程序负责HDFS数据存储。A. DatanodeB. NameNodeC. JobtrackerD. SecondaryNameNode答案:A14.(单选)HBaSe是分布式列式存储系统,记录按什么集中存放。A.列族B.歹IC.行D.不确定答案:A15.(填空)哪个进程负责M叩RedUCe任务调度。答案:J
11、obtraCkerL(单选)分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫O,另一类存储具体数据叫()A.数据节点,名称节点B.名称节点,主节点C.从节点,主节点D.名称节点,数据节点答案:D2.(单选)下列AmaZOn的云数据库属于关系数据库的是()A.AmazonDynamoDBB.AmazonRedshiftC.AmazonRDSD.AmazonSimpleDB答案:C3 .(单选)下列关于NoSQL数据库和关系型数据库的比较,不正确的是OA.NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言B.NoSQL数据
12、库很容易实现数据完整性,关系型数据库很难实现数据完整性C.NoSQL数据库的可扩展性比传统的关系型数据库更好DZoSQL数据库具有弱一致性,关系型数据库具有强一致性答案:B4 .(多选)下列对HBaSe的理解正确的是()A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件B.HBase是针对谷歌BigTable的开源实现C.HBase是一种关系型数据库,现成功应用于互联网服务领域D.HBase多用于存储非结构化和半结构化的松散数据答案:BD5 .(单选)HBaSe是一种()数据库A.行式数据库B.关系数据库C.文档数据库D.列式数据库答案:D6 .(单选)下列数据库属于文档
13、数据库的是A.HBaseB-MongoDBC.MySQLD.MongoDB答案:D7 .(单选)NoSQL数据库的三大理论基石不包括A.CAP8 .最终一致性C.BASED.ACID答案:D8 .(多选)HDFS只设置唯一一个名称节点带来的局限性包括。A.命名空间的限制B.集群的可用性C.隔离问题D.性能的瓶颈答案:ABCD9 .(判断)目前,NoSQL的含义是“NotonlySQL”,而不是“NoSQL”。A.B.答案:B10 .(判断)一个数据库事务具有AClD是指:原子性,一致性,持久性,隔离性。A.B.答案:A1 .(单选)下列哪些不是数据来源OA.商业教据B.互联网教据C.物联网教据
14、D.人工收集教据答案:D2 .(单选)下列不是数据采集的主要渠道是()A.传统信息系统B.大数据系统C.物联网系统D.Web系统答案:B3 .(单选)下列数据质量的评估标准,不正确的是OA.完整性B.可替代性C.一致性D.及时性答案:B4 .(多选)下列关于数据质量的影响因素理解正确的是OA.信息因素B.人为因素C.信息因素D.流程因素答案:ABD5 .(单选)下列不是大数据采集方法的是OA.系统日志采集B.网络数据采集C.数据库采集D.手动采集答案:D6 .(多选)下列属于大数据预处理的方法的是()A.数据清洗B.数据集成C.数据变换D.数据归约答案:ABCD7 .(多选)处理噪声数据的方法包括()A.分箱8 .平滑处理C.聚类D.清洗答案:ABC8 .(判断)忽略元组的方法可以使用该元组的剩余属性值A.B.答案:B9 .(判断)大数据预处理技术就是对已接收数据的辨析抽取和清洗A.B.答案:A10 .(判断)大数据的数据采集是指通过传感器、摄像头、RFID射频数据以及互联网等方式获取的各种结构化、半结构化和非结构化的数据。A.B.答案:A