《2024年大数据应用及处理技术能力知识考试题库与答案.docx》由会员分享,可在线阅读,更多相关《2024年大数据应用及处理技术能力知识考试题库与答案.docx(34页珍藏版)》请在优知文库上搜索。
1、2024年大数据应用及处理技术能力知识考试题库与答案、单选题1 .当图像通过信道传输时,噪声一般与O无关。A、信道传输的质量B、出现的图像信号C、是否有中转信道的过程D、图像在信道前后的处理参考答案:B2 .在留出法、交叉验证法和自助法三种评估方法中,O更适用于数据集较小、琲以划分训练集和测试集的情况。A、留出法B、交叉验证法C,自助法D、留一法参考答案:C3 .在数据科学中,通常可以采用O方法有效避免数据加工和数据备份的偏见。A、A/B测试B、训练集和测试集的划分C、测试集和验证集的划分D、图灵测试参考答案:A4 .下列不属于深度学习内容的是(_)。A.深度置信网络B、受限玻尔兹曼机C、卷积
2、神经网络D、贝叶斯学习参考答案:D5 .在大数据项目中,哪个阶段可能涉及使用数据工程师来优化数据查询性能?A、数据采集B、数据清洗C、数据存储与管理D、数据分析与可视化参考答案:C6 .假定你现在训练了个线性SVM并推断出这个模型出现了欠拟合现象.在下一次训练时,应该采取下列什么措施()A、增加数据点B、减少数据点C、增加特征D、减少特征参考答案:C7 .两个变量相关,它们的相关系数r可能为0?这句话是否正确OA、正确B、错误参考答案:A8 .一幅数字图像是0。A、一个观测系统B、一个由许多像素排列而成的实体C、一个2-D数组中的元素D、一个3-D空间中的场景参考答案:C9 .以下说法正确的是
3、:().一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的如果增加模型更杂度,那么模里的测试错误率总是会降低如果增加模型笈杂度,那么模型的训练错误率总是会降低,1B、2C.3D、1.and3参考答案:C10 .从网络的原理上来看,结构最豆杂的神经网络是O。A、卷枳神经网络B、长短时记忆神经网络C、GRUD、BP神经网络参考答案:B11 .1.Snf中,(_)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。A、输入门B、遗忘门G输出门D、更新门参考答案:A12 .MatP1.otiib的核心是面向().A、过程B、对象C,结果D、服务参考答案:B13 .诊断性分析主要采取的分析
4、方法是()和0。A、关联分析和因果分析法Ik关联分析和分类分析法C、关联分析和运筹学D、因果分析和分类分析法参考答案:A14 .信息增益对可取值数目0的属性有所偏好,增益率对可取值数目。的属性有所偏好。A、较高,较高B、较高,较低C、较低,较离D、较低,较低参考答案:B15 .关于掂本数据的元数据是指O。A、基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息B,基本元数据包括与企业相关的管理方面的数据和信息C、基本元数据包括日志文件和简历执行处理的时序调度信息D、基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息参考答案:D16 .标准BP.算法的目标是使训练集上的。为
5、最小。A,累积方差B、累枳误差C、累积协方差D、累积偏差参考答案:B17 .假负率是指()。A、正样本预测结果数/正样本实际数B、被预测为负的正样本结果数/正样本实际数C,被预测为正的负样本结果数/负样本实际数D、负样本预测结果数/负样本实际数参考答案:B18 .bootstrap数据是什么意思0。A、有放回地从总共M个特征中抽样m个特征B、无放回地从总共M个特征中抽样m个特征C、有放回地从总共N个样本中抽样n个样本D、无放回地从总共N个样本中抽样n个样本参考答案:C19 .划分聚类算法是-种简单的较为基本的重要聚类方法。它的主要思想是通过将数据点集分为O个划分,并使用重亥的控制策略使某个准则
6、最优化,以达到最终的结果A、DB,KC、ED、F参考答案:B20 .有N个样本,一般用于训练,一般用于测试。若增大N值,则训练误差和测试误差之间的差距会如何变化O。A、增大B、减小C、无法确定D、无明显变化参考答案:B21 .O是指给目标用户产生的错误或不准确的视觉感知,而这种感知与数据可视化者的意图或数据本身的真实情况不一致。A、视觉假象B、视觉认知C、视觉感知D、数据可视参考答案:A22 .以下滤波器对图像中的椒盐噪声沌波效果最好的是O。A、中值中波B、均值滤波3最大值港波D、最小值港波参考答案:23 .MaPRedUCe中,ShUff1.e操作的作用是O.A、合并B、排序C、降维D、分区
7、参考答案:B24 .时于SVM分类算法,待分样本集中的大部分样本不是支持向世,下列说法正确的是O。A、需要将这些样本全部强制转换为支持向量B、需要将这些样本中可以转化的样本转换为支持向量,不能转换的直接删除C、移去或者减少这些样本对分类结果没仃影响D、以上都不对参考答案:C25 .下列对于Sig1.nOid函数的说法,错误的是()A、存在梯度爆炸的问翘B、不是关于原点对称C、计算QXP比较耗时D、存在梯度消失的问题参考答案:26 .决策树模型的规模应当是0.A、越更杂越好B、越简单越好C、适当限制其竟杂程度D、尽可能利用所有特征参考答案:C27 .在大数据分析中,使用K-means聚类算法时,
8、通常需要预先指定哪个参数?A、聚类的中心数(K值)B、数据集的大小C、数据的维度D、聚类的形状参考答案:28 .在大数据可视化中,哪种图表最适合展示数据的层次结构或分类关系?A、树状图B,折线图3散点图D、热力图参考答案:A29 .在大数据处理中,使用流式处理(StreamProcessing)的主要优势是什么?A、实时性B、更高的数据处理精度C、更好的数据一致性D、更低的存储成本参考答案:A30 .以下哪个不是大数据处理中常见的机器学习克法?A、级性回归B、决策树C、傅里叶变换D、随机森林参考答案:C(傅里叶变换主要用于信号处理,不是机器学习算法)31 .在大数据项H中,哪个阶段可能涉及使用
9、数据科学家来评估模型的准确性和性能?A.数据采集B、数据清洗3模型评估与调优D、数据可视化参考答案:C32 .在大数据安全中,哪种技术或措施常用下保护数据在存储过程中的安全性?A、加密技术B、防火墙C、访问控制D、入侵检测系统参考答案:A33 .以下哪个是APaChCKafka在大数据生态系统中的主要角色?A、实时数据处理引擎B,分布式文件系统C、高吞吐量分布式发布-订阅消息系统D、数据仓库参考答案:C34 .在大数据项目中,哪个阶段通常涉及时数据分析结果的解读和向非技术用户展示分析结果?A、数据采集B.数据仅处理C、数据分析D、数据可视化与报告参考答案:D35 .在大数据分析中,使用决策树以
10、法的主要目的是什么?A、预测分类结果队发现数据中的关联规则C、压缩数据大小D、实时处理数据流参考答案:A36 .以下哪个不是大数据处理中常见的非结构化数据类型?、文本文件B、音频文件C、数据库表D、视频文件参考咨案:C(数据库表通常被认为是结构化数据)37 .在大数据项Fi中,哪个阶段可能涉及使用数据科学家来构建预测模型?A、数据采集B.数据清洗3数据分析与建模D、数据可视化参考答案:C38 .在大数据可视化中,使用哪种图表可以更好地展示数据随时间变化的趋势?A、面枳图B、饼图C,雷达图D、散点图参考答案:A39 .在大数据处理中,为J提高处理效率,通常会采用哪种策略来减少数据传输量?A、数据
11、压缩B、增加数据节点C、降低处理精度D、使用更快的网络参考答案:A10.在大数据安全中,哪种技术或措施通常用于防止SQ1.注入攻击?A、加密技术B、访问控制3参数化咨询D、数据脱敏参考答案:C41 .在大数据项目中,哪个阶段可能涉及使用数据工程师来设计和优化数据存储架构?A、数据采集B、数据清洗C、数据存储与管理D、数据分析与可视化参考答案:C42 .下面关于词袋模型说法错误的是O。A、词袋模型使用一个多重集对文本中出现的单词进行编码B,词袋模型不考虑词语原本在句子中的顺序C、词袋模型可以应用于文档分类和检索,同时受到编码信息的限制D、词袋模型产生的灵感来源于包含类似单词的文档经常有相似的含义
12、参考答案:C43 .以下哪个不是大数据处理中常见的ET1.(EXtraCt,Transform,1.oad)过程的一部分?A、数据提取B、数据清洗C、数据可视化D、数据加载参考答案:C44 .在大数据分析中,使用神经网络进行图像识别时,哪一层通常负贡学习数据的特征表示?A、输入层B、隐藏层C、输出层D、激活层参考答案:B45 .在大数据可视化中,哪种图表最适合用于比较不同类别的数据占比?A、饼图B,折线图C,轴线图D、雷达图参考答案:46 .在大数据可视化中,哪种图表最适合用于展示多个变量之间的关系?A,散点图B、折线图C、饼图D、热力图参考答案:A47 .当相关系数r=0时,说明0。A、现象
13、之间相关程度较小B、现象之间完全相关C、现象之间无直线相关D、现象之间完全无关参考答案:C48 .在大数据项目中,哪个阶段可能涉及使用数据科学家来制定数据科学策A、数据采集B、项目规划C、数据清洗D、数据可视化参考答案:B19.大数据的“Variety”特性主要指的是什么?R、数据址的大小B、数据处理的速度C、数据的类盘和结构多样性D、数据的其实性和准确性参考答案:C50 .在大数据安全中,哪种技术或措施常用于保护数据传输过程中的安全性?A、加密技术B、访问控制C、防火墙D、入侵检测系统参考答案:A51 .关于数据分析,下列说法正确的是()。A、描述性分析和预测性分析是对诊断性分析的基础B、断
14、性分析分析是对规范性分析的进一步理解C、预测性分析是规范性分析的基础D、规范性分析是数据分析的最高阶段,可以直接产生产业价值卷考答案:C52 .增加卷积核的大小对手改进卷积神经网络的效果是必要的吗OA、是的,增加卷积核尺寸一定能提面性能B、不是,增加核函数的大小不定会提高性能参考答案:B53 .三维以上数组是以。的形式输出的。A、按行输出B、按矩阵输出C、按矩阵列表输出D、按字符串输出参考答案:C54 .从连续图像到数字图像需要O。A.图像灰度级设定B,图像分辨率设定C、确定图像的存储空间D、采样和量化参考答案:D55 .以下分割方法中不属F区域算法的是O.A、分裂合并B、阈值分割C、区域生长D、边缘检测参考答案:D56 .以下哪个不属于数据治理的内容。A、理解自己的数据B、行为规范的制定C、岗位职费的定义D、获得更多的数据参考答案:D57 .数据故事话的“情景不包括0。R、还原情景B、统计情景C、移植情