《营销数据分析案例合集.docx》由会员分享,可在线阅读,更多相关《营销数据分析案例合集.docx(93页珍藏版)》请在优知文库上搜索。
1、第1章绪论案例分析利用最近一次的营销活动的信息,分析什么对推销结果的影响最大,如何确定银行定期产品推销中最具价值的客户。1数据理解数据源来自CSDN:代码下载链接https:/download,字段名wage年舲(数值)职业(分类:admin,bluecollar,entrepreneur,housemaid,management,retired,self-employed,services.student.technician,unemployed.jobL.unknown)maritalIftfi状况(分类:divorced,married,single,unknown)education
2、学历primary,secondary,tertiaryandunknown)default(维:yes.no)balance资产余额(数值)housing房屋费款(分头:yes,no.unknown)loan个人斑歆(分类:yes.no.unknown)contactcellular,telephone)day最后一次电话营侑的日期(数值:月份中的,-天)month最后一次电S的月份(分关:jan.feb.mar.apr.nov.dev)duration通话时长(数值:以秒为单位,0的话最终输出结果必然是0)campaign联系次JK(掰S:此活动联系该书户的次80Pdays正上次联系完育尸
3、后的大散(Kffi:999代表未联系过该膏户)previous会活热与这位所(ttB)p欠SWS果(分类:yes.no,unknown)deposit定期存歆(分类:yes,no)存户是否已附买定期存歆2数据清洗此次数据除了部分未知数据(unknown),其它暂不需要清洗。3确定思路balance目前推测应该是客户存放在银行的资金(负数应该代表欠了银行钱),不可能是代表这个人的个人全部资产(银行得不到这方面的信息),所以暂时留着。然后是day和Inonth,如果说有年份的话还能将其分为周一周二等,但是没有,数据集出处也没有明确标注是哪年,所以如果用来分析的话可能也只能按月来分析,但按以往的经验
4、和数据量的大小来看,应该用处不大。至于duration,因为当duration为。时结果必然是失败的,说明这个数据的记录应该是银行人员在营销完记录下的,而现实中无法在营销前就得到该数据,所以这个数据没有用。那么接下来我们如何下手呢?首先我们可以将数据分为两种类型:1、客户的个人信息2、营销人员与客户的联系信息那么接下来我们可以按照这两种数据提出几个问题:1、用户的个人信息是否对结果有着明显的影响(哪些属性影响大)?2、营销人员的行为是否对结果有着明显的影响(哪些属性影响大)?4分析过程4.1年龄此时我们探究年龄与结果是否有明显的影响。首先我们可以查看以下数据集中的年龄统计分布情况:567891
5、011121314151617181920MSssssssssssssss QGGOSSGBs yyyyyyyyyyyyyyyv 5426Q7B石096152911- 5!5456(323l3(2433!34 4 丝误数并 值值数 均准位数淮弟度度减小大和渊 V标中众林方峰偏区最求观412319 0.112763931 119134 141928 062154 0 86278771895 46023111162可以发现共有11162名最小值为18,最大值为95,最小值为18。我们可以按照我们的认知,将客户分为几个不同年龄阶段。123456789区间1818=x353535=x505050=x6
6、56565=x人年人组年年老年分青中中老bankSheetl画-JI1卜1=S0平均值:42i-tt15求圆圆凹I205%分组的话主要是用到了VLKUP函数进行分组。REPLACE一XV6卜VL。KUP(A2,SheetI1A:C,3,TRUE)JABCDEFGHIJ1ae年龄分组obmaritaleducationdefaultbalancehousincloancontactd2345678910111213141516175641555442566037人人年年人人年年SecondannosecodanoSecondannoSecondannotertiarynotertiarynote
7、rtiarynosecodanosecondannotechniciarmarriedmanagerrmarriedretireddivorcedadmn.marriedadmin,marriedtechniciarmarriedservicesmarriedadrn.marriedservicessinglesecondarynoadmin,singleSecondannoblue-colicmarriedsecodannomanagerrmarriedtertiarynoblue-colicsingletertiaryotechniciarsingletertiarynomanagerrd
8、ivorcedtertiaryo2343yesnounknown45nonounknown1270yesnounknown2476yesnounknown184nonounknownOyesyesunknown830yesyesunknown545yesnounknown1yesnounknown5090yesnounknown100yesnounknown309yesounknown199yesyesunknown460yesnounknown703yesnounknown3837yesounknown此时得到分组后,我们可以生成数据透视表来查看情况。,计数项:deposit列标签行标签I老
9、年人值年向老年人使年noyes总计19.76%8024100.%49.36%50.64100.%53.39%46.61*100.%58.06%41.94*100.%52.6247.381.从图当中我们可以明显的看到在老年人群体中最终购买了定期存款的比例最大,为80.2%,而其他群体最终的结果并没有明显的差距。4.2失信状况default计数项:deposit列标签行标签noyes总计有失信记录5757523710994无失信记录11652168总计5873528911162default无失信记录有失信记录的在结果上没有什么差别,无失信记录的最终购买的比例低于没有购买的,但是数据量较小,不能作
10、为参考。4.3个人资产balance同年龄一样,balance是数值型,因而最好先将其分组。balance图表标题差误数差值值数均准位数准差度度域小大和测平标中众标方峰偏区最最求观1528.5430.5291550O3225.411E+O7126.8618.2246288051-6847812041.7E07111629870065000043002IO(XX)O-I(XXX)-200这里我主要采用箱型图来查看balance数据的分布,以便后续进行分组。可以看到的是数据主要是集中在0-2000之间,有少部分低于该区间,然后有部分大于该区间。按下图进行分组:-68476847=x0O0=1000
11、100O1000=x200020002000=x500050005000=x=81204偏超组债低等高高结果如下:项签数标假低等高高计计行负中中偏超总列标签no69.48%56.0347.342.11%42.8052.62%yes总计30.52%100.00%43.97%100oo的52.62%100.0057.89%IoooO的57.20%l.00%47.38%l.00%80.00%70.00%60.00%50.00%40.00%30.00%20.00%10.00%0.00%IiiiIiIiP负债中低中等偏高超高资产分组.Y这里主要可以发现的是负资产的客户最终购买的可能性较低,而资产较高的客
12、户购买的可能性稍微大些。4.4 housing&loan接下来的房屋贷款和个人贷款,这个我打算放在一起进行分析。具体如下:计数项:deposit无房贷42.97%57.03Hl.00无个贷40.35%59.65100.00%有个贷64.96%35.04l.00%有房贷63.36%36.64%l.00*无个贷62.44%37.56%l.00%电数项:deposit列标签行标签 N no yes 总计有个贷68.26% 3174% 100.00%52.62% 47.38 100.00%80.0(W6总计70.00%60.00%50.0OH40.0030.00%20.0OH10.0W60.0096d
13、eposit . no yes无个贷 有个货 无个货 有个贷无房贷有房贷可以看到无房贷和无个人贷款的客户最终购买的可能性最大,为59.65%。其余的只要有任何一个贷款购买的可能性就比较低。4.5 上次营销结果PoUtCome同理,生成透视图查看一下:计数项:deposit列标签行标签.noyes总计failure49.67%50.33100.00success8.691.32%100.00%总计30.58%69.42%100.00%i谶次 depositpoutcome Y(包括这次在内,当生成透视图时发现有部分数据(如Unknown、other)是我们不想要的,记得筛选掉)从图中我们可以明显发现,上次营销成