《2024年数据分析师LevelⅡ考试题库(含答案).docx》由会员分享,可在线阅读,更多相关《2024年数据分析师LevelⅡ考试题库(含答案).docx(74页珍藏版)》请在优知文库上搜索。
1、2024年数据分析师LevelII考试题库(含答案)一、单选题1.将原始数据进行整合、变换、特征降维、缺失值处理是在以下哪个步骤的任务A、数据预处理B、数据挖掘C、分类和预测D、模式发掘参考答案:A2 .问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类?A、哥特曼(guttman)量表B、李克特5点测量量表C、李克特3点测量量表D、李克特9点测量量表参考答案:B3 .假设我们使用LogistiC.回归模型分析n类分类问题,在这种情况下,我们可以使用留一法(One-Vs-rentmothoD.)。关于这个问题,下面哪个选项是正确的A、我们需要在n类分
2、类问题中拟合n+1个模型B、我们需要在n类分类问题中拟合1个模型C、我们需要在n类分类问题中拟合n个模型D、我们需要在n类分类问题中拟合n-l个模型参考答案:D4 .针对该公式y=3xy(t-l)2xy(t-3)是()阶的时间序列A、1B、3C、2D、4参考答案:B5 .在逻辑回归输出与目标对比的情况下,以下评估指标中哪一项不适用?A、均方误差B、 AUC-ROCC、 1.oglossD、准确度参考答案:A6 .能够用于总体估计的是A、自愿抽样B、滚雪球抽样C、方便抽样D、系统抽样参考答案:D7 .某分析师希望通过聚类算法进行欺诈分析,发现结果不是很理想。下列方法中哪项不能为聚类效果带来提升?
3、A、对变量进行主成分分析B、对变量进行变量聚类C、对变量进行分箱处理D、对变量进行标准化参考答案:C8 .在因子分析中,为了帮助解释因子,可以使用()A、因子负载B、因子得分C、因子旋转D、主成分分析参考答案:C9 .以下哪种方法可以用于仓析面板数据A、自回归法(A.R)B、移动平均值法(MA.)C、随机效应法(RM)D、差分法参考答案:C10 .多元线性回归中,检验异方差的方法是?A、如果回归拟合值与自变量相关则存在异方差B、如果回归残差与因变量相关则存在异方差C、如果回归因变量与自变量相关则存在异方差D、如果回归残差与自变量相关则存在异方差参考答案:B11 .从两个总体中独立选取两个样本,
4、两个总体的方差未知,但是样本为大样本,则两个总体的平均值之差的估计需要用到A、正态分布B、卡方分布C、F分布D、t分布参考答案:C12 .单因素方差分析中,计算F统计量,其分子与分母的自由度各为A、r-11,n-rB、n-r,r-lC、r,nD、r-l,11-r参考答案:D13 .研究性别与是否失眠的相关性,可以用A、偏度B、卡方检验C、F检验D、T检验参考答案:B14 .下面关于回归分析,说法错误的是?A、按照自变量和因变量的函数关系来分类,可以分为线性回归分析和非线性回归分析B、非线性回归问题可以转化为线性回归C、线性回归对异常值不敏感D、按照自变量和因变量的个数来分类,可分为一元回归分析
5、和多元回归分析参考答案:C15 .主成分分析法的主要作用是A、剔除异常值B、控制变量C、正则化D、降维参考答案:D16 .在推导线性回归参数时,我们会做出以下哪些假设?(1)因变量y和预测变量X之间的真实关系是线性的;(2)模型的误差在统计意义上是独立的;误差通常分布是均值为0,且标准差为常数;(4)预测变量X是非随机的,而且不存在测量误差A、1,2,3,4B、1,2,3C、1,3,4D、1,2参考答案:A17 .以下哪种情境更适合使用线性回归?A、考察广告费对产品销售量的影响B、考察目标客户的行为规则,做出用户画像C、考察五个城市居民的有效收入的差异是否显著D、考察哪些客户最终是否购买产品参
6、考答案:A18 .以下哪个不是分群标签的用途?A、服务于产品和服务匹配策略B、定位客户的需求C、建立对客户的洞察D、解决工作的效率问题参考答案:D19 .主成分分析的前提条件是各变量之间应该满足A、低度相关B、相互独立C、完全相关D、高度相关参考答案:A20 .某电商的年销售量呈现Xt=O.72Xt-l0.81Xt-2t,则xt为()A、ARIMA(n,m)B、AR(n)C、M(m)D、ARMA(n,m)参考答案:B21 .用户分层是在用户管理时最常被使用的标签类型,其中RFM模型是指()A、投入、效率、产出B、成交率、客流、客单价C、首次购买时间、消费频率、消费金额D、最近购买时间、消费频次
7、、消费金额参考答案:D22 .在方差分析中,多重比较的目的是通过配对比较来进一步检验A、哪两个样本均值之间有差异B、哪两个样本方差之间有差异C、哪两个总体方差之间有差异D、哪两个总体均值之间有差异参考答案:D23 .以下哪个不属于根据麦肯锡问题分析方法中的分类:A、问题解决型问题B、追求理想型问题C、恢复原状型问题D、防范潜在型问题参考答案:A24 .时间序列MA(q)模型,其中q指的是OA、时间序列的偏自相关系数是q阶截尾的B、时间序列的自相关系数是q阶拖尾的C、时间序列的偏自相关系数是q阶拖尾的D、时间序列的自相关系数是q阶截尾的参考答案:D25 .为了估计北京市使用华为品牌手机的市场占有
8、率,在收集数据时,最有可能采用的数据搜集方法是?A、方便抽样B、配额抽样C、实验D、随机抽样参考答案:D26 .以下哪个不属于根据麦肯锡问题分析方法中的分类:A、恢复原状型问题B、防范潜在型问题C、问题解决型问题D、追求理想型问题参考答案:C27 .回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此,在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种?A、因子分析B、卡方分析C、方差分析D、相关分析参考答案:A28 .关于K-MeA.ns算法
9、,正确的描述是?A、不能使用核函数B、能找到任意形状的聚类C、初始值不同,最终结果可能不同D、每次迭代的时间复杂度是O(n2),其中n是样本数量参考答案:C29 .一个一元线性回归模型的判定系数R2=0.8,那么下列解释中错误的是()A、在训练集中,因变量的估计精度上限为80%B、自变量与因变量之间有着较强的线性关系C、在因变量的变动中有80%是由自变量所决定的D、因变量的变差中有80%的概率可以由自变量与因变量之间的线性关系来解释参考答案:A30 .多元线性回归中F检验的原假设是A、所有回归系数都等于预估值B、所有回归系数都不等于预估值C、所有回归系数都不等于0D、所有回归系数都等于0参考答
10、案:D31 .以下哪种方法可以用于分析面板数据A、自回归法(AR)B、差分法C、随机效应法(RM)D、移动平均值法(MA)参考答案:C32 .以下关于一元线性回归分析y=bobix+s描述错误的是?A、一元线性回归中F检验的检验统计量与t检验是一致的B、若用于预测的X数值与样本中的自变量偏差很大,那么预测得到y的可靠性也会降低C、即便建立了一元线性回归,也不能直接认为X是y的原因D、一元线性回归中F检验的作用与t检验是一致的参考答案:A33 .假设我们使用Logistic回归模型分析类分类问题。在这种情况下,我们可以使用留一法(One-VS-restmethod).关于这个问题,下面哪个选项是
11、正确的A、我们需要在n类分类问题中拟合1个模型B、我们需要在n类分类问题中拟合n-l个模型C、我们需要在n类分类问题中拟合n+1个模型D、我们需要在n类分类问题中拟合n个模型参考答案:B34 .对于一元线性回归,回归系数显著性检验需要用到A、Z检验B、t检验C、卡方检验D、F检验参考答案:B35 .有一款产品的重量标准为10克,现在分别用A和B两个厂家来生产这一产品,分别各随机抽取50个样品,A厂生产的样本重量的标准差为0.01,B厂生产的样本重量的标准差为0.1,现在需要比较两家广商在产品重量指标是否有显著差异,我们应该选择A、单侧t检验B、双侧t检验C、单侧F检验D、双侧F检验参考答案:B
12、36 .应用回归分析应注意的问题,下面说法错误的是?A、回归分析的自变量选取要符合业务需要,选择合适的数据资料B、回归分析的自变量必须是连续型数据C、应用回归分析时,要注意时间窗口的一致性D、因为回归分析是研究自变量与因变量的因果关系,所以要注意孰因孰果参考答案:B37 .在进行多元线性回归分析时,对于变量较多的情况下,可以选择变量筛选方法,下列不正确的是A、交叉验证法B、向后剔除法C、向前选择法D、逐步法参考答案:A38 .回归分析中定义的A、解释变量和被解释变量都为非随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都是随机变量D、解释变量为随机变量,被解释变量
13、为非随机变量参考答案:B39 .若线性规划问题没有可行解,可行解集是空集,则此问题()A、没有无界解B、没有无穷多最优解C、有无界解D、没有最优解参考答案:D40 .主成分分析的前提条件是各变量之间应该满足A、低度相关B、完全相关C、相互独立D、高度相关参考答案:A41 .在时间序列分析中,指数平滑法的平滑系数A.的取值A、越小越好B、取值范围在T到1之间C、取值范围在0到1之间D、越大越好参考答案:C42 .以下关于系统聚类的描述中,错误的是()A、系统聚类也叫层次聚类B、系统聚类适用于数据量非常大或者变量非常多的项目C、系统聚类法通常分为自底向上和自顶向下D、系统聚类的过程非常清楚,会形成
14、类似树状的聚类图谱,便于理解和检查参考答案:B43 .下列关于主成分分析的表述不正确的有()A、所确定的几个主成分之间是高度相关的B、所确定的几个主成分之间是互不相关的C、使用主成分分析方法的前提是原来的多个指标之间是相关的D、主成分分析的目的是寻找少数几个主成分代表原来的多个指标参考答案:A44 .在系统聚类中,我们需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响?A、离差平方和法B、最短距离法C、最长距离法D、以上都不是参考答案:A45 .多元线性回归中,检验异方差的方法是?A、如果回归拟合值与自变量相关则存在异方差B、如果回归残差与因变量相关则存在异方差C、如果回归残差与自变量相关则存在异方差D、如果回归因变量与自变量相关则存在异方差参考答案:C46 .多元线性回归中检验的原假设是A、对应单个回归系数等于OB、对应单个回归系数不等于OC、对应单个回归系数等于预估值D、对应单个回归系数不等于预估值参考答案:A47 .如果时间序列的各期增长量相等,A、各期环比增长速度有升有降B、环比增长速度逐期上升C、各期的环比增长速度保持不变D、环比增长速度逐期下降参考答案:D