《2024年数据价值挖掘技能竞赛决赛试题库500题(供参考).docx》由会员分享,可在线阅读,更多相关《2024年数据价值挖掘技能竞赛决赛试题库500题(供参考).docx(63页珍藏版)》请在优知文库上搜索。
1、2024年数据价值挖掘技能竞赛决赛试题库500题(供参考)一、单选题1.中文同义词替换时,常用到Word2Vec,以下说法错误的是。.A、WOrd2Vec基于概率统计B、Word2Vec结果符合当前预料环境CxWord2Vec得到的都是语义上的同义词D4Word2Vec受限于训练语料的数量和质量答案:C2 .O是以样本统计量作为未知总体参数的估计量,并通过对样本单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。A、参数估计B、逻辑分析C、方差分析D4回归分析答案:A3 .图像平滑会造成。A、图像边缘模糊化B、图像边缘清晰化Cx无影响仇以上答案都不正确答案:A4 .以下代码
2、的输出结果为O。As1,2.3.4.1,2.3.4Bx1,2,3,4,1.2,3.4G1.2.3.4D、1,2.3.4.1.2.3,4答案:A5 .scipy.stats,moment函数的作用是。A、随机变量的概率密度函数B4随机变量的累积分布函数Cv随机变量的生存函数D4计算分布的非中心矩答案:D6,已知一个数据集,n为特征数,m为训练样本数,如果n较小,而且m大小中等(例如n为11000,而m为1010000),则一般选择。A、逻辑回归模型Bv不带核的支持向量机C、高斯核的支持向量机D4多项式核的支持向量机答案:C7 .以下代码的输出结果为。A、012345Bs0.6252.6254.6
3、25G(array(O,625,2,625,4.625),array(8.,8.8.)Dv以上答案都不正确答案:B8 .Python语句Print(0xA+0xB)的输出结果是()A40xA+0BBxA+BGOxAOxBDx21答案:D9 .K折交叉验证器是以下哪个()方法O。A、modeI_seIection.GroupKFoId)BvmodeI_seIection.GroupShuffIeSp1.it)C、modeI_seIection.KFoId)DvmodeI_seIection.RepeatedKFoId)答案:C10 .随机森林与Bagging中基学习器多样性的区别是().A4都来
4、自样本扰动Bv都来自属性扰动C4来自样本扰动和自属性扰动D4多样本集结合答案:C11 .常见的图像预处理方法不包括O.A、图像降噪Bv图像增强C4图像尺寸归一化D4图像标注答案:D12 .逻辑回归将输出概率范围限定为0,1。O函数能起到这样的作用i.A、SiKnIoid函数Bvtanh函数C4Re1.U函数Dx1.eakyRe1.U函数答案:A13 .在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在。A、异方差B4序列相关C、多重共线性D4高拟合优度答案:C14 .一幅灰度均匀分布的图像,其灰度范围为0.255,则该图像的信息量为。Av0B、6Cx8A、频
5、繁模式挖掘B4分类和预测C.数据预处理D数据流挖掘答案:C19 .如果在大型数据集上训练决策树.为了花费更少的时间来训练这个模型,下列哪种做法是正确的()A4增加树的深度B4增加学习率C4减小树的深度D4减少树的数量答案:C20 .下列方法中,不可以使用类名访问的是。Ax实例方法B4类方法Cs静态方法D、以上答案都不正确答案:A21 .下列关于IPython的说法,错误的是OoA、IPythOn集成了交互式PythOn的很多优点;IPython的性能远远优于标准的Python的SheII;C、IPython支持变量自动补全,自动收缩;D、与标准的PythOn相比,IPythOn缺少内置的功能和
6、函数;答案:D22 .下列关于数据转换,正确的是O。A、JSon内的取值只能有统一格式B、PDF文件在不同平台上打开显示不同C4可以通过Python将CSV文件转换成ExceI格式D.Exce1.存储数据的量无限制答案:C23 .下面哪行代码中最适合接受系统输入的一个整数是。Axnum=input)Bnum=input(6)Cxnum=int(input)O4num=fIoat(input)答案:C24 .机器学习中,基于样本分布的距离是。Ax马氏距离B4欧式距离C4曼哈顿距离D4闵可夫斯基距离答案:A25 .对于线性回归模型,包括附加变量在内,以下可能正确的是。A、1和2B、1和3Cs2和4
7、D4以上都不是答案:D26 .下列方法中,不属于情感分析的评测的方法是。.AxCOAE评测B、Cifar1.O数据集评测GCFTCCI评测DtTAC评测答案:B27 .以下关于PandaS数据读写说法错误的是O。A,rea1.CSV能够读取数据库的数据B4read_sq1.能够读取数据库的数据C、to_csv函数能够将结构化数据写入CSV文件0.to.exce1.函数能够将结构化数据写入EXCe1.文件答案:A28.k近邻算法在。的情况下效果较好。A4样本较多但典型性不好B4样本较少但典型性好C4样本呈团状分布D、样本呈链状分布答案:BCv关键字g1.oba1.定义全局变量时必须自成一行D4n
8、on1.oca1.变量不可以在内嵌函数中使用答案:D148 .当特征值大致相等时会发生的情况是OA、PCA将表现出色B、PCA将表现不佳C4不知道D4以上都没有答案:B149 .以下说法正确的是().A、一个机器学习模型如果有较高准确率,总是说明这个分类器是好的Bs如果增加模型复杂度,那么模型的测试错误率不一定会降低C.如果增加模型复杂度,那么模型的训练错误率总是会降低D、-答案:C150 .下列关于HDFS的描述正确的是。Ax如果NameNOde宕机,SeCOndaryNameNode会接替它使集群继续工作B4HDFS集群支持数据的随机读写CNameNode磁盘元数据不保存B1.ock的位直
9、信息DataNode通过长连接与NameNOde保持通信答案:C151 .以下关于异常处理的描述,正确的是O,A、try语句中有except子句就不能有fina1.Iy子句B、Python中,可以用异常处理捕获程序中的所有错误C4引发一个不存在索引的列表元素会引发NameError错误D4Python中允许利用raise语句由程序主动引发异常答案:D152 .()不是SPark服务层的功能。A4SQ1.查询B4实时处理C4机器学习D、内存计算答案:D153 .标准正态分布的均数与标准差是OAv0,1B、1,0C、0,0D、1,1答案:A154 .Numpy中确定随机数生成种子使用以下哪个的函数
10、是().A4np.random)Bvnp.random,seed)C、np.uniform)Dsnp.eig)答案:B155 .以下跟RNN相关的是。A.梯度消失B4时间步C4梯度爆炸D4以上答案都正确答案:D156 .图像中虚假轮廓的出现就其本质而言是O。A、图像的灰度级数不够多而造成的Bv图像的空间分辨率不够高而造成的C4图像的灰度级数过多而造成的Ds图像的空间分辨率过高而造成的答案:A157 .下列去噪方法中,能较好地保持图像边缘的去噪方法是OA4中值滤波Bv双边滤波C4均值浅波Dv高斯滤波答案:A158 .以下关于break,ContinUe的说法,正确的是。答案:c161 .一组数据
11、的最大值与最小值之差叫作做()。A.标准差B,极差C、方差Ds极小值答案:B162 .下列数据类型中,NunIPy不支持以下哪种数据类型的是。.AvfIoat32Buint64Cboo1.D%byte答案:D163 .对模型进行超参数优化,详尽搜索指定参数的估计值使用以下哪种0方法OAxParameterGrid)BtParameterSIer)CvGridSearchCV)D、RandomiZedSearchCV)答案:C164常用的数据归约方法可以分为()。A4维归约、数据压缩B、维归约、参数归约C4维归约、值归约D4数据压缩、值归约答案:C165. O的基本想法是适当考虑一部分属性间的相
12、互依赖信息,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系.A4贝叶斯判定准则B4贝叶斯决策论C4朴素贝叶斯分类器D4半朴素贝叶斯分类器答案:D166. Re1.ief是为。问题设计的.Av二分类Bs多分类C4回归D降维答案:A167. 现阶段的大数据技术体系主要类型不包括OA.数据源与APPB4基础设施CkHadoopDx数据资源答案:c168. scipy中模块io的作用是。A,差值计算B4程序输入输出C4稀疏矩阵D、优化答案:B169. 关于Python赋值语句,以下选项中不合法的是().A1x=1:y=1B、 x=y=1C、 x=(y=1)D、X,y=y,X答
13、案:C170 .选择哪一个解作为输出,将由学习算法的归纳偏好决定,常见的做法是引入OAx线性回归Bv线性判别分析C4正则化项D4偏置项答案:C171 .请以下代码的输出结果为()。As312Bt120Cv123D4123答案:B172 .Numpy默认产生的数据类型是O。A、int16BtfIoat32CvharDtfIoat64答案:D173 .客户端从HDFS上读取数据时会。A4从NameNode上获取数据B从DataNOde上获取B1.OCk位置Cv从NameNOde上获取BIOCk位置O4从NaIneNode上获取数据和B1.。Ck位置答案:C174 .jieba分词包含的分词模式有O
14、.A、精确模式B4全模式C4搜索引擘模式D、以上答案都正隔答案:D175 .如果字符串中有*需要匹配,需要输入的正则袤达式为。B、W*Cx*D、(*)答案:A176 .11p.where(True.Fa1.se.True1True,1,2.3,419,8,7,6),最终的输出结果是OAv1,4.9,7B,1,3.9,7C、1,8.3,42,9.3.6答案:C177 .数据科学中,人们开始注意到传统数据处理方式中普遍存在的“信息丢失”现象,进而数据处理范式从。转向。A、产品在先,数据在后范式;数据在先,产品在后范式或无模式Bv模式在先,产品在后范式;产品在先,模式在后范式或无模式C、数据在先,模式在后范式或无模式;模式在先,数据在后范式D4模式在先,数据在后范式;数