《国家开放大学2023年7月期末统一试《24154大数据技术概论》试题及答案-开放专科.docx》由会员分享,可在线阅读,更多相关《国家开放大学2023年7月期末统一试《24154大数据技术概论》试题及答案-开放专科.docx(4页珍藏版)》请在优知文库上搜索。
1、2023年7月选出最符合)不属于这试卷代号:24154国家开放大学2023年春季学期期末统一考试大数据技术概论试题一、单项选择题(本题共20小题,每小题3分,共60分。请在给出的选项中,题目要求的一项)1 .下列各项不属于数据的是()。A.文本B.图像C.视频D.印象2 .下列各项不属于大数据特征的是()。A.体量大B.种类多C.真实性D.数据生成慢3 .数据异常值的处理方法不包括()。A.极小值替换B.删除C.忽略D.视为缺失值进行填补4 .下列各项不能用于描述数据集中趋势的是()。A.方差B.平均数C.中位数D.峰值5 .下列各项不属于HadOOP的特点是()。A.存储迅速B.成本高C.计
2、算能力强D.灵活性强6 .在工业网络实时监控系统中,需要连续不断地采集和处理数据。以下(种计算模式。A.在线处理B.实时处理C.流式计算D.批量计算7 .下面不是研究数据方法的是()。A.统计学B.机器学习C.心理分析D.数据挖掘8 .下面不属于大数据的处理过程的是()。.数据获取B.数据清洗C.数据分析D.数据安全9 .下面不属于大数据计算模式的类型的是()。A.批量计算B.手动计算C.流式计算D.交互式计算10 .下列各项属于合规数据的是()。A.非法收集隐私信息数据B.取得使用者同意的个人资料数据C.泄露的隐私信息数据D.垄断数据ILHDFS架构中的主节点(名称节点)负责()。A.接收来
3、自客户端的作业请求B.接收来自用户的数据读取请求C.创建数据块D.删除数据块12 .下列有关SOL数据库的局限性,描述错误的是()。A.结构化数据建模B.已有数据结构的变化成本高Ce空间利用率低D.无法保证事务处理的可靠性13 .为展示两个数值型变量之间的相关关系,常用的可视化方法是()。A.箱线图B.直方图C.饼图D.散点图14 .无法用来反映高维数据之间关系的可视化方法是()。A.相关系数矩阵图B.散点图矩阵C.气泡图D.平行坐标图15 .噪声是指测量数据中的()。A.随机误差B.均值C.方差D.极差16 .下列各项不属于大数据在金融领域的应用的是()。A.风险管理B.客户分析C.运营优化
4、D.社交网络舆情17 .按照预先设定的搜索规则,编写程序自动浏览并下载目标网页信息的数据采集方法称作()。A.系统日志信息数据采集方法B.ETL工具数据采集方法C.网络爬虫数据采集方法D.传感器数据采集方法18 .关于传统数据与大数据的获取与处理,下列描述中错误的是()。A.传统的数据获取来源单一B.采用关系型数据库和并行数据库可以处理传统数据C.获取大数据的数据来源广泛D.大数据的数据量相对较小19 .常见的离散化方法中,()的基本思想是将样本等分成若干份,各组所包含的样本个数相同,组限是相应分位数上的分位值。A.组距分组B.分位数分组C.秩分组D.均值一标准差分组20 .下列各项不属于数据
5、仓库的特点的是()。.将分析处理与事务数据库分离B.整合来自不同数据源、不同类型的数据C.数据质量高D.数据仓库是面向应用而设计的二、判断题(本题共10小题,每小题2分,共20分。以下叙述中,你认为正确的打,错误的打“X”)21 .根据数据在收集过程中是否控制有关因素,可以将数据分为观测数据和实验数据。()22 .时间序列分析中采用对数变换来消除异方差。()23 .关系型数据库不是用来存储和访问具有彼此相关性数据的数据库。()24 .气泡图中气泡的面积大小没有实际意义。()25 .数据科学是通过科学方法探索数据,以获得有价值的发现。()26 .数据科学的发展不仅可以推动学科的发展,而且能够助推
6、相关产业的发展与进步。()27 .网页数据是一种半结构化数据。()28 .批量数据处理是一种在线计算模式,可以满足系统对数据进行实时处理的需要。()29 .银行业通过大数据技术可以有效分析经营过程中可能存在的风险因素。()30 .适当地使用数据脱敏技术,可以有效地减少敏感数据在采集、传输、使用等环节中的露,降低敏感数据泄露的风险。()三、简答题(本题共4小题,每小题5分,共20分)31 .数据的定义是什么?32 .大数据的成因是什么?33 .数据整理的内容主要包括哪四个方面?34 .通过相关系数矩阵处理共线性问题的算法步骤是什么?试卷代号:24154国家开放大学2023年春季学期期末统一考试大
7、数据技术概论试题答案及评分标准(供参考)2023年7月一、单项选择题(本题共20小题,每小题3分,共60分。请在给出的选项中,选出最符合题目要求的一项)1.D2.D3.A4.D5.B6.D7.C8.D9.B1O.BILA12.D13.D14.C15.A16.D17.C18.D19.B20.D二、判断题(本题共10小题,每小题2分,共20分。以下叙述中,你认为正确的打y,错误的打“X”)21.22.23.X24.X25.26.27.28.29.30.三、简答题(本题共4小题,每小题5分,共20分)31 .数据的定义是什么?数据是对现象或事物进行测量和记录的结果,可用来制表、计算和分析等,也可以统指一切保存在电脑中的信息,能够进行电子化的记录,包括文本、图像、音频、视频等。32 .大数据的成因是什么?数据的存储和管理能力的增强;数据采集能力增强;大数据的挖掘和分析等技术的同步发展。33 .数据整理的内容主要包括哪四个方面?数据的提取;数据的连接;数据的聚合;去除冗余和重复。34 .通过相关系数矩阵处理共线性问题的算法步骤是什么?计算相关系数矩阵;确定最大的成对相关系数对应的预测变量A和预测变量B;计算变量A与其他所有变量之间的平均绝对值相关系数,对变量B也做同样的计算;比较A与B,谁的平均绝对值相关系数最大,删除谁;重复以上步骤,直到两两之间绝对值相关系数低于某一特定阈值。