《电商数据挖掘分析报告.pptx》由会员分享,可在线阅读,更多相关《电商数据挖掘分析报告.pptx(21页珍藏版)》请在优知文库上搜索。
1、01行业背景与现状方方面面数据背景该数据集为某跨国电商交易数据集,交易发生时间段为2010.12.01-2011.12.09。该公司主要销售礼品,并且大部分客户是批发商。行业背景与现状总的说来,中国还处在一个很不成熟的阶段,交易规模远低于发达国家水平。而且,网民参与网上交易的比例与发达国家相比也有一定的距离。零售业是实现各种商品的价值和使用的重要途径,是反映一个国家物质文明和精神文明建设成果的重要窗口。行业背景与现状iiMedia Research(艾媒咨询)数据显示,2019年上半年,中国的网络零售总额已达到195209.7亿元,占社会零售总额的24.7%,截至2019年,中国移动电商用户规
2、模将突破7亿人。零售业是实现各种商品的价值和使用的重要途径,是反映一个国家物质文明和精神文明建设成果的重要窗口,并担负着促进生产,繁荣市场和满足人民生活多方面需要的重要任务。中国零售企业的发展历程,同时是信息技术在零售业中应用范围不断扩大的的历程。但总的说来,中国还处在一个很不成熟的阶段,交易规模远低于发达国家水平。而且,网民参与网上交易的比例与发达国家相比也有一定的距离。我国零售电子商务企业的服务质量还有待提高。数据清洗重复值删除R异常值处理数据读入缺失值处理用户编号缺失处理读入Online Retail.xlsx订单记录重复值删除数据预处理购买数量异常分析客户编号类型转换时间变量处理MDE
3、可视化及描述性分析月销售金额通过可以看到也在稳步上升。由于数据集中只有成交信息、产品信息、地区和时间,具体变化原因没办法具体判断,推测可能是年底的促销活动引起的。可视化及描述性分析从时间的维度发现,客户更喜欢在中午10点到14点间进行购物,12点是购物的高峰期,期间可以进行线上推广。月订单金额和月购买数量的趋势相近,再结合客单价可以看到四月份环比急剧下降的原因,客单价跌至低谷。可视化及描述性分析从国家维度发现,前六的国家在购买数量,金额,订单数量上都比较稳定,属于重要价值客户。英国在三个维度下都远远领先于其他国家,属于重要价值客户,次要客户作为重点发展对象,可以适当进行推广、促销活动,争取提升
4、为重要客户。可视化及描述性分析退款率随时间不断下降,是一个很好的状态。11月份销售额非常高,退单数也很高,但是退单率却很低。可视化及描述性分析复购率每月有2次消费记录的次数每月有3次及以上消费记录的次数通过复购率,有助于我们根据客户的重复购买行为及时地作出调整,从图中可以看到12月份复购率大幅度下跌,推测在促销活动后便没有后续活动或批发商大批量已在11月份大批量进货,为圣诞促销做准备,致使12月货源充沛无需进货。总体来看复购率较为稳定。模型建立消费频次统计R用户交易最近的日期间隔天数客户消费金额统计FM建立RFM模型,通过RFM模型对用户价值进行分类,不同价值用户采取不同的业务决策。购买力偏态
5、严重,大部分是经销商进货产生的大金额订单,多多利用这些渠道。流程构建用户行为表1选取订单成功数据离散数据读热编码234归一化SSE系数观察轮廓系数分析 Y轴均表示聚类的K值变化。为选择最优K值进行拟合,对K值变化下的SSE系数和轮廓系数进行对比分析。模型应兼顾SSE最小且轮廓系数较大,因此选择K值为10进行重新聚类。 通过重新进行聚类分析后,得到相似用户分类情况表。1.1.用户购买表2.2.用户- -未购买商品表3.3.未购买商品类别用户最终推荐表 通过构建用户购买表、用户-未购买商品表、未购买商品-类别-用户表,形成最终推荐表。 针对订单成功的记录,对离散型数据(产品、国家)进行独热编码,构
6、建用户行为表。通过Kmeans聚类的方式,对相似用户进行归类,为推荐系统做初步准备。根据相似用户购买行为,构建不同产品的推荐指数,为用户提供未购买产品的推荐指数。 英国是主要的客户来源地区,而德国、法国、荷兰、爱尔兰和澳大利亚成交金额表现不错,可以作为重要发展对象,可以适当进行推广、促销活动,争取提升为重要客户。 一般发展客户较多说明近期的营销策略很好,引入了不少流量。同时流失客户也不少,但是推广见效了。而一般价值和一般保持客户虽然消费频次高,但是比例占少数,对于公司来讲运费成本高,收益少。 由于大部分客户是批发商,购买数量和金额较大;用户消费次数越多,消费金额越大,可以每隔一段时间对用户进行召回。THANKS!恳请各位老师和同学批评指正!