新闻中心
未明学院数据分析报告:分析了淘宝用户后,我发现“最败家”的人都集中在……(未名大学是什么)
报告作者:赵漫麒 Cassie 周爽
未明学院商业数据分析训练营优秀学员
项目报告:《淘宝用户价值分析报告》
随着互联网技术的不断发展和完善,网络购物逐渐融入我们的生活,并改变着我们的生活方式。
与传统购物相比,网络购物打破了时空限制,大幅降低了交易成本、时间成本和精力成本,消费者可以随时随地的进行商品浏览和交易,前所未有的提升了消费者的购物弹性。
伴随着人们网购认同度的提高,电商大战也日益白热化,淘宝、苏宁、京东商城等各大电商各出奇招、争夺市场份额。
根据2017年的中国线上零售市场占有率报告来看,阿里巴巴以67%的市场占有率独占电商行业鳌头。淘宝网于2018年5月公布其注册用户达8.7亿,成为了最成功的购物网站。
图:2017线上零售业市场占有率
来源:公开资料整理
对于电商B2C行业而言,用户无疑是发展的核心。发现用户、吸引用户、留住用户,是当前电商需要正视的关键问题。
作为电商中的领军者,淘宝网也不能只停留在现在的辉煌,必须在日趋复杂的国内外经济环境中牢牢把握用户这一核心,不断寻找新的利润增长点并尽可能扩大业务量才能保持竞争优势。
如何基于现有用户,挖掘潜在用户,制定有效的营销策略?未明学院商业数据分析训练营赵漫麒等同学利用所学数据分析技能,完成了《淘宝用户价值分析报告》。一起来看下数据能给我们带来怎样的市场营销战略启发吧~~
RFM模型
RFM模型是衡量客户价值和客户创利能力的重要工具和手段,它通过一个客户最近购买日Recency,各期购买频率Frequency,各期平均单次购买金额Monetary三项指标来描述该客户的价值状况。
关于其应用重要性的说明:
管理用户生命周期:消费频率高的用户和消费时间越近的顾客会有极大的可能性再次消费。
新用户的再次转化:用户的使用习惯、品牌信任度会随着使用服务次数的增加而增加,所以对于辛辛苦苦花了很高的市场营销费用拉过来的新用户,一定要想方设法地促进他们完成多次消费。想办法提高新用户的消费频次,才能尽可能的留住他们,让他们成为有价值的用户。
高价值用户的留存:帕雷托法则——公司80%的收入来自20%的顾客。消费金额越高的用户有着更强的消费能力,对于我们而言代表跟多价值。应对其提供针对性的服务。
数据来源与说明
研究对象:阿里巴巴集团淘宝电子商务平台消费用户
数据来源:阿里巴巴
样本覆盖城市:全国2个省包括31个城市及海外部分地区
样本量:样本一:14635 样本二:17517
统计周期:2011年3月1日至5月31日
模型应用:
R(recency):用户在样本内的最近消费时间
F(frequency):用户在样本内的购买频率
M(monetary):用户在样本内的消费总金额
数据预处理
用户信息数据处理
原始用户信息数据
处理后数据
交易情况数据处理
原始商品交易数据
处理后数据
部分最终数据:

数据建模
K-means聚类结合RFM模型——将处理后的数据,利用Kmeans函数,进行聚类分析,并为每个客户赋予标签:
绘制的全部用户RFM情况和标签散点图
由于(用户最近一次购买距今的时间)的数值非常接近,根据(购买频率)和(购买金额)来看:
第2组顾客是最有价值消费者他们购买频率极高,而且消费金额多。因此他们极有可能会在之后继续此类消费行为:高频高消费。以此我们将主要根据第二类顾客作为对象分析
可视化分析
地区
从图中可以明显地看出我们的关键客户集中于沿海地区,排在前五位的是:浙江652位,上海487位,江苏471位和广东293位。而内陆地区主要是:四川的339位和北京的314位。
因此,为了更好地迎合这些地区的用户,建议依据地区制定符合当地特色的营销方案和产品内容。
各个城市地消费额总计
根据各个城市地消费额总计分析,重要消费群体主要分布在:上海、浙江杭州市、北京市、四川成都市和重庆市。
根据前面消费用户地数量对比,可以发现某些省市地消费群体数量虽然巨大,但是像上海、北京这类一线城市的平均消费额明显高于其他城市,所以针对这类城市,建议加强高端市场的打造。
然而类似辽宁、山东省,这类消费群体数量较为庞大,但是消费金额却不尽如人意,说明平均消费金额相对较低,那么建议针对这类地区的市场多向用户推荐价格较亲民的商品类型。
地区与收入水平
地区的发展水平和消费者的收入水平直接影响着其消费行为,根据2011年公示的省份与市经济发展水平来看:
1. 浙江江苏上海四川北京广东辽宁这七个省市的GDP总量都是全国排名靠前的。
2. 除了四川之外,可以发现其余6个省市的人均收入水平也是位居全国前茅。
3. 消费较高的城市也大多是省会城市,有用较高的经济发展水平和收入。
地区与“她”经济
随着女性经济和社会地位提高,围绕着女性理财、消费而形成了特有的经济圈和经济现象被称为“她”经济。
该图为根据顾客性别和数量的地区分布图,由图可分析得到:“她经济”的现象十分显著,女性客户占据整体重要用户的大部分。
根据性别与RFM模型的综合分析得出:
消费频率(F):不同性别的购买频率是相近的
消费时间(R):不同性别的最近一次购买相差不过一天,但是以中位数做代表来看,女性顾客比男性顾客发生交易的日期更近
消费金额(M):男女的主要购买金额的差异巨大,女性的总体消费金额是男性的4.7倍
用户信用等级
男女性顾客基本在不同信用等级成比例分布,未见明显的集中。
最重要的买家信用等级主要集中在:3-7级(3星级-2钻)。
2钻用户与3钻及以上用户消费额度发生断层,猜测是否对于3钻以上的高消费群体的商品信息投放出现偏差或者这类用户预期的服务与优惠未能满足,导致消费行为丢失。
用户消费情景
不论性别,用户都对case1(购买一种商品)有着绝对偏好,绝大多数用户在case1下发生购买行为。
虽然大多数购买行为发生在case1下,但是男女最平均重复购买频率在不同的case下有着差别。可以看见,在case2(购买2种商品)的情况下,男性平均重复购买次数是大于女性的,猜测对于部分男性更偏好在case2下发生重复购买行为。
年龄
1. 客户年龄跨度大。
2. 不同年龄的消费频率和最近一次消费时间差距小。
3. 根据每个年龄段总体的消费金额,主要是20-35岁的购买者居多。
市场营销战略维度
客户定位
客户定位的方式可以从以下三个方面来考虑:
客户的外在属性:本数据中的客户外在属性为客户的地域分布,如集中分布的浙江、上海、江苏、四川、北京等省和直辖市。
客户的内在属性:内在属性指客户的内在因素所决定的属性,在本数据中为:性别(如女性消费者居多)、年龄(如中青年消费者居多)、信用等级(以3星级-2钻用户居多)。
客户的消费属性:即我们所用的RFM模型,在本数据中为:用户最近消费时间、用户购买频率、用户消费总金额。
消费行为
除此之外,我们还应该考虑非常复杂的消费者的购买行为。
Kotler根据Assael(1978)的研究,以不同涉入度水平和品牌间差异进行了四种类型的消费者购买行为划分:
无论是高度介入还是低度介入的产品,我们都需要通过平台和运营监管去把控产品质量和做好品牌宣传,将复杂型购买行为和多变型购买行为转化为和谐型购买行为和习惯性购买行为,从而增加销量。
市场营销战略总结
产品营销策略
1. 对明星产品进行包装和营销。
2. 可以专门针对高价值用户提高服务水平、给他们更大的优惠幅度、设置用户购买奖励等等。
3. 我们还应该利用个性产品吸引顾客,使战斗产品早日成为明星和英雄产品,相对应地赢得品牌和利润。
地域营销策略
1. 对于上海北京等一类城市,建议加强高端市场的营销。
2. 而类似辽宁、山东省,这类消费群体数量较为庞大,但是消费金额却不尽如人意,说明平均消费金额相对较低,那么建议针对这类地区的市场多向用户推荐价格较亲民的商品类型。
用户信用程度
1. 针对高消费高集中的用户等级,建议建立消费者社群以维护客户关系。
2. 建议加强3钻及以上类用户的商品种类投放准确性和服务内容,刺激用户消费升级。
消费情景
1. 整体引发case1的发生,增加整体购买行为的发生。
2. 针对部分男性群体引导case2的发生提高该群体的重复购买次数。
女性营销策略
定期举办如”女神节”,”妇女节”等类似活动,针对女性客户给予直接的商品价格优惠如促销,或者支付优惠如免息分期付款的方式以刺激女性群体的消费。
以上就是本期分析报告的全部内容。看完是不是对大数据有了进一步的认识?
期待小伙伴们更多优秀有意思的作品哦~~