《数据分析中常见图表的应用场景及优缺点对比.docx》由会员分享,可在线阅读,更多相关《数据分析中常见图表的应用场景及优缺点对比.docx(20页珍藏版)》请在优知文库上搜索。
1、数据分析中常见图表的应用场景及优缺点对比在数据可视化领域我们经常使用各种图表来形象直观的展现数据,业务人员或者数据分析人员可以通过图表分析公司业务的经营状况,发现公司经营过程中潜在的隐患,还可以通过图表挖掘其中潜在的价值。那么常见的图标有咖些?在什么场景下使用样的图表才能更好的展现数据呢?一、常见的图表1 .柱图(柱状图)mill柱图,又称柱状图。是一种以长方形的长度来表达数据的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。场景:适合用于展示二维数据集,展示数据的分布情况,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值,比如:(月份,商品销量),或者在一个维度上,对多个同
2、质可比的指标的比较,比如:(月份,苹果销量,桃子产量)优点:简单直观,很容易根据柱子的长短看出值的大小易于比较各组数据之间的差别缺点:不适合较大数据集的展现类似图表:条形图、直方图、堆积图、百分比堆积图、双Y轴图等2 .线图(折线图)多指标布线IS线图:也叫折线图,将值标注成点,并通过直线将这些点按照某种顺序连接起来形成的图。场景:数据在一个有序的因变量上的变化,它的特点是反应事物随类别而变化的趋势,可以清晰展现数据的增减趋势、增减的速率、增减的规律、峰值等特征。优点:能很好的展现沿某个维度的变化趋势能比较多组数据在同一个维度上的趋势适合展现较大数据集缺点:每张图上不适合展示太多折线类似图表:
3、堆积图、曲线图、多指标折线图、双Y轴折线图、面积图3 .饼图(扇形图)11O9020ratio夕饼图:以饼状图形显示一个数据系列中各项的大小与各项总和的比例,也称作扇形统计图。场景:适用于二维数据,即一个分类字段,一个连续数据字段,当用户更关注与简单占比时,适合使用饼图。优点:简单直观,很容易看到组成成分的占比缺点:不适合较大的数据集(分类)展现数据项中不能有负值当比例接近时,人眼很难准确判别类似图表:环形图、3D饼图4 .散点图散点图:又称XY散点图,将数据以点的形式展现,以显示变量间的相互关系或者影响程度,点的位置由变量的数值决定。场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断
4、两变量之间是否存在某种关联,或者发现数据的分步或者聚合情况优点:可以展示数据的分布和聚合情况适合展示较大的数据集缺点:散点图看上去比较乱,基本上只能看相关、分布和聚合,其他信息均不能很好展现类似图表:气泡图5 .雷达图(蜘蛛网图)(六边形战士)雷达图:又称蜘蛛网图,将多个维度的数据量映射到起始于同一个圆心的坐标轴上,结束于圆周边缘,然后将同一组的点使用线连接起来。场景:雷达图适用于展现多维数据集优点:适客展现某个数据集的多个关键特征适合展现某个数据集的多个关键特征和标准值的比对适合比较多条数据在多个维度上的取值缺点:多维度但是不能太多,一般四到八个比较的记录条数不宜太多6 .漏斗图漏斗图:有多
5、个梯形从上而下叠加而成。从上到下的项有逻辑上的顺序关系,梯形面积表示某个业务量与上一个环节之间的差异。场景:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观的发现和说明问题所在的环节,进而做出决策。说明:漏斗图总是开始于一个100%的数量,结束于一个较小的数量在开始和结束之间由N个流程环节组成,每个环节用一个梯形来表示梯形的上底宽度表示当前环节的输入情况,下底表示当前环节的输出,上底与下底之间的差异表现了在当前环节业务量的减小量,当前梯形边的斜率表现了当前环节的减小率漏斗图的所有环节的流量都应该使用同一个度量类似图表:金字塔图、对称漏斗图(旋风)、对
6、比漏斗图7 .树图3.乐万765369097555459350894629786树图:树图是通过树形结构来展现数据的组织关系,以父子层次结构来组织对象,是枚举法的一种表达方式。场景:适用于与组织结构有关的分析,即有明确的层次关系的数据优点:直观的展现层次关系可以看到各层级指标间的关系,可以进行简单的上卷、下钻等操作缺点:数据层级不宜过多每层的成员不宜过多无法展现各部分占比关系类似图表:矩阵树图8 .矩阵树图矩阵树图:采用矩形表示层次结构的节点,父子层次关系用矩阵间的相互嵌套来表达。从根节点开始,空间根据相应的子节点数目被分为多个矩形,矩形面积大小对应节点属性。每个矩形又按照相应节点的子节点递归
7、的进行分割,直到叶子节点为止。场景:适合展现具有层级关系的数据,能够直观体现同级之间的比较优点:图形更紧凑,同样大小的画布可以展现更多的信息可以展现成员间的权重缺点:不够直观、明确、不像树图那么清晰分类占比太小时不容易排布类似图表:树图、马赛克图,热力图9 .来源去向图110.9万210.9 万受110.9 万8.503万1420万W!1420万来源去向图:通过页面访问量PV和访客数量UV推算出网页的转化率,进而可以了解网站的整体运营效果和某一类商品的最终成交量场景:非常单一,适用于电商与营销有关的分析,比如分析购物网站中,哪些商品最畅销或者哪一个时间段是访问高峰。优点:特别适合分析展现网站流
8、量的运营数据显示结果直观,可以清晰的看到各个维度指标变化的情况支持以某个节点查看该节点所在流程的情况缺点:应用面很窄,只能显示三级维度的流程数据对显示的度量要求严格10 .指标看板3.206万4.215万3.89万6.423万iJt1”5tEfJmS58-fEMBX砌fSBW1.842万14561.668万643011t“5tf11*flIl切6E指标看板:通过文字、数字和符号和合理排版,对数据进行一目了然的展示。由看板标签和看板指标组成,标签由维度决定,指标由数据的度量决定。场景:适合用来展示一个维度下的一个或者多个度量,特别是对某些指标需要精确读数的场景。优点:展薪的是详细的数字,用户得到
9、的都是精确信息简单直观,重点数字突出,容易得到关键信息缺点:展现维度只能有一个展现指标不宜过多只是数字面板,不具有图形的各种优势11 .仪表盘仪表盘:像一个钟表或者可读盘,有刻度和指针,其中刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。场景:管理报表或报告,直观的表现出某个指标的进度或实际情况优点:适用于场景比较窄,主要用于进度或占比的展现只能一个维度,指标也不宜过多,展示信息有限类似图表:堆积图12 .地图地图,使用地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分步通过颜色或者气泡映射在地图上。场景:适合带有地理位置信息的数据集展现,展现的通常是
10、以某个地区为单位的汇总的连续信息优点:和地图向结合,对数据的地理分步显示直观通过颜色深浅、气泡大小等容易判断度量的大小缺点:必须有地理信息,且数据为汇总数据,气泡容易叠加显示的都是非精确值,气泡大小和颜色深浅相近时不易分辨地理面积大小和度量值无关,容易误读类似图表:气泡地图、颜色地图(分级统计地图)、秒点地图13.极坐标图极坐标图,由多个扇区构成。每个扇区的标签由数据的维度决定,每个扇区的长度由数据的度量决定。每个扇形的角度一样,通过半径展示变化。场景:适用于枚举数据之间的比较,比如显示一段时间内的数据变化,或显示各项之间的比较情况。优点:视觉效果在部分情况下比其他图表更佳同样的画布能比部分其
11、他图表展示数据更多缺点:不适合分类过少的数据集不适合部分度量过小的数据集类似图表:饼图、环图、柱图、玫瑰图14 .词云图南省西藏区广西省懿M山西省.福建省1 M盘肾,鲁映.词云图,又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。场景:做用户画像,对用户进行聚类,实现精细化营销。适合用于描述网站上的关键字(即标签),或可视化自由格式文本,可以对比文字的重要程度。其本质是点图,是在相应坐标点绘制具有特定样式的文字的结果优点:快速感知最突出的文字,或区别权重不同的文字可展示大量文本缺点:不适合展现数据太少的数据集不适展现区分度不
12、大的数据,即无重点关键词类似图表:点图、柱图二、图表类型和使用场景m 1 rwIlll100OBBMImm ortr*ww p*nwt* m*wVM7a* ImMMJil XAU IOOMfeKeUflB tD9t安德鲁阿伯拉(AndrewAbela)制作的这份指南(ThiSGUide)是思考图表类型的一个很好的起点,但不要把它用作决策引擎。并不是人人都同意他对图表类型的组织方式,层级结构也并未包含所有有效的图表类型。事实上,这里显示的每个图表都有许多变体和混合,而且人们时时刻刻都在创建出新的图表类型。此外,当你想要拓展自己的思维,尝试多种方法时,这个工具可能缩小你的思考范围。但是,它将帮助你
13、理解各种形式的类别(例如,比较和分布),并且可能激发你尝试一些新东西。我已经对这份指南进行了调整,使之与“交谈-画草图-创建原型”的框架相适应。至于我是怎样调整的,请参见下图。ar4%aaraBfvumMMtttIillilG/Iillil012X2矩阵也叫矩阵,水平和垂直平分的方框,形成了四个象限。它常用于说明基于两个变量的类型。优点:针对元素分类和“区域”创建的易于使用的组织原则缺点:在不同的空间间隔绘制象限内的项,暗示两者可能不存在统计关系02冲积图也称为流图,显示值怎样从一个点移动到另个点的节点和流。这通常用于展示值在一段时间内的变化,或者其组织方式的细节,例如,预算拨款如何逐月使用。
14、优点:在值的更改中公开详细信息,或者在广泛数据类别中公开地详细分解缺点:流中的许多值和变化导致复杂而且交叉的视觉效果,虽然很漂亮,但可能很难解释03条形图表示类别之间关系(“分类数据”)的高度或长度不等的条形。常用来比较同一指标下的不同群体,如10位不同CEo的薪酬。(当条形图垂直时也称为柱状图。)缺点:许多条形图可能会造成趋势线的印象,而不是突出离散值;多组条形可能变得难以解析延伸阅读:手把手教你用直方图、饼图和条形图做数据分析(PythOn代码)04气泡图散布在两次测量上的点,为数据增加了第三个维度(气泡大小),有时增加了第四个维度(气泡颜色),以显示几个变量的分布。常用来表示复杂的关系,如绘制不同国家的多个人口数据块。(也被错误地称为散点图。)优点:合并“z轴”最简单的方法之一;气泡大小可以为分布式的可视化图表增加至关重要的上下文缺点:按比例调整气泡大小是棘手的(面积与半径不成比例);从本质上说,三轴和四轴的图表需要更多的时间来解析,因此不太适合于一目了然的表示延伸阅读:什么是气泡图?怎样用Python绘制?有什么用?终于有人讲明白了05凹凸图也称为疙瘩图(bumpsChart),显示随着时间推移的排名顺序变化的线条。常用来表示受欢迎程度,如每周的票房排名。