新闻中心

电商数据分析(数据分析篇)(电商数据统计网站)

2023-05-23
浏览次数:
返回列表

上一篇文章中,我们对一份美国2020年电商数据进行了前期的数据处理,具体内容可查看下面的链接。

倾葱:电商数据分析(数据处理篇)0 赞同 · 0 评论文章

这篇文章中,我们将在处理好的数据的基础上进行分析和可视化呈现。

在分析数据前,先提出一些问题:

2020年的不同时间里,产品都卖得怎么样?哪些地区比较有购买力?客户都消费了多少钱?买了多少次?哪些客户比较有购买力?哪些产品比较挣钱?商品折扣对销售额和利润的影响是怎样的?

下面,我们将从时间、地区、客户、产品和折扣几个方面对数据进行分析。

销售额和利润随时间变化的情况

插入数据透视表,将订单日期作为数据透视表的行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作折线图。

由图可以看出,销售额是随着时间逐步增长的。但是,9-12月期间销售额明显增长时,利润却没有随着销售额的增长而增长。

想要找出这一现象背后的原因,我计算了利润和这份数据中其他类型为数值的列(销售额、数量、折扣)的相关系数。

选中销售额、数量、折扣、利润这四列的数值部分,再选择:数据→数据分析→相关系数,选择确定后,把各列修改成对应的名称,得到下图。

由图可知,折扣与利润呈明显的负相关,于是我选择以折扣为切入点来分析。

在本文后面关于折扣的分析中,可以看到低于八折的商品的利润总和是负数。于是我将数据按八折及八折以上、八折以下的标准分成两部分,然后分别分析这两部分数据的销售额和利润的情况。

选中折扣列中的一格,选择升序排列,再选中折扣为0-0.2的所有数据,在此基础上插入数据透视表,将订单日期作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作条状图。

再按照折扣对全表进行降序排列,选中折扣为0.3-0.8的所有数据,然后重复一遍上面内容的后续操作,得到另一个条状图。

对比这两张图就能发现:八折及八折以上商品各月份的利润都是正数,且利润会随着销售额的增长而增长;八折以下商品各月份的利润都是负数,且随着销售额增长,亏的钱越来越多。

仔细查看11月的利润也可发现:11月八折以下商品的负利润抵消了八折及八折以上商品带来的利润增长,使得11月的总利润(9690.10)跟8月的总利润(9040.96)差不多。这就解释了为什么9-12月销售额明显增长但利润却没有明显变化。

总的来说,9-12月期间有大量折扣商品售卖,推测是感恩节、圣诞节、元旦等节日的预热和促销的缘故。大概是折扣商品吸引了消费者来购买,使得销售额上涨。但是由于低折扣商品亏本,就导致了销售额上涨但利润未上涨的情况。要改善这一情况,就需要仔细衡量商品折扣的设置了。

各地区销售情况

插入数据透视表,将区域作为行,勾选销售额(求和项)作为统计值进行分析,然后制作柱状图。

插入数据透视表,将州作为行,勾选销售额(求和项)作为统计值进行分析,然后制作柱状图。

插入数据透视表,将城市作为行,勾选销售额(求和项)作为统计值进行分析,然后选出销售额排名前十的城市。

由上面的分析图可知,各个区域的销售额从高到低依次是西部、东部、中部和南部。

销售额靠前的州主要是位于东部和西部的加州(California)、纽约州(New York)、华盛顿州(Washington)等。

销售额靠前的城市也主要是位于东部和西部的纽约(New York City)、西雅图(Seattle)、洛杉矶(Los Angeles)、费城(Philadelphia)等。

客户情况

插入数据透视表,将客户类型作为行,勾选客户ID(计数项)作为统计值进行分析,然后制作饼图。

从客户类型来看,有50%的客户是个人消费者,30%的客户是公司,20%的客户是家庭办公室。

之前在数据处理过程中,我依据客户的累计购买金额,将客户分成了不同的档次(如下图所示)。

这里,我们要选中中间这部分包含购买金额档次的表,在此基础上插入数据透视表,以客户ID作为行,勾选购买金额档次(计数项)作为统计值进行分析,然后制作柱状图。

由图可知,0-500美元这个金额档次的客户数目最多,有305个客户,说明大部分客户2020的消费额都在500美元以下。

随着购买金额档次的升高,相应档次的客户数量也在减少。到3500-4000及更高的金额档次中,对应的客户人数都只有个位数了。

回到原来有所有数据的表格,在此基础上插入数据透视表,将客户ID作为行,勾选销售额(求和项)作为统计值进行分析,然后选出销售额排名前十的客户。

可以看出,RB-19360、TA-21385、HL-15040是购买金额最多的三个客户,累计购买金额都超过了一万美元,其他购买金额靠前的客户也买了超过五千美元的商品,这些客户可以作为重要客户重点维护。

接下来分析客户这一年中购买次数的情况。因为分析的需要,会进行两次数据透视。

插入数据透视表(注意勾选将此数据添加到数据模型),将客户ID作为行,勾选订单号(非重复计数)作为统计值进行分析。将数据透视表的两个列名修改为客户ID和修改次数,得到结果如下图所示。

把第一次数据透视生成的表复制到一旁,选中复制的表(上图中红色的部分),再次插入数据透视表,将购买次数作为行,勾选客户ID(计数项)作为统计值进行分析,然后制作条状图。

由图可知,有200名客户在这一年内仅购买一次,另外有200名和156名客户分别购买了2次和3次,购买次数为3次以上的客户数量明显减少。

在客户情况分析的最后部分,我想知道:客户在购买商品时,都选择了什么样的运输模式。

插入数据透视表,将运输模式作为行,勾选订单号(计数项)统计值进行分析,然后制作饼图。

大部分客户(57%)都选择了费用便宜的标准运输模式,其次是二等(20%)和一等(17%),而当天送达这种最贵的运输模式仅有6%的客户选择。

产品销售情况

插入数据透视表,将产品类别作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作柱状图。

插入数据透视表,将产品子类别作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后制作横向柱状图。

由图可知,销售额和利润从高到低的产品大类依次是科技、办公和家具。

销售额最高的三个子类别分别是科技/手机、家具/椅子、办公/活页夹。利润最高的三个子类分别是科技/复印机、科技/电子配件、科技/手机。

下面要统计销售额和利润排行前十的产品。因为我发现有不同的产品共用一个产品ID的情况,所以这里我选择用产品名称来进行统计。

插入数据透视表,将产品名称作为行,勾选销售额(求和项)和利润(求和项)作为统计值进行分析,然后分别选出销售额排行前十和利润排行前十的产品。

将销售额前十的产品和利润前十的产品结合在一起看,发现佳能复印机(Canon imageCLASS 2200 Advanced Copier)、惠普复印机(Hewlett Packard LaserJet 3310 Copier)、GBC电动装订系统(GBC DocuBind TL300 Electric Binding System)、三星手机(Samsung Galaxy Mega 6.3)这四款产品表现良好,在销售额和利润上都做到了排名前十。

有几款产品如马丁电动开信刀(Martin Yale Chadless Opener Electric Letter Opener)、Cubify3D打印机(Cubify CubeX 3D Printer Triple Head Print)、Fellowes电动冲床(Fellowes PB500 Electric Punch Plastic Comb Binding Machine with Manual Bind)等虽然销售额很高,但是总利润为负数。

折扣

下面来看下折扣的情况。插入数据透视表,将折扣作为行,勾选数量(求和项)作为统计值进行分析,然后制作柱状图。

插入数据透视表,将折扣作为行,勾选销售额(求和项)和利润(求和项)统计值进行分析,然后制作柱状图。

由图可知,大部分商品都没有折扣或者打了八折。相应的,没有折扣的商品和打八折的商品的销售额和利润也较高。

有意思的是,低于八折的商品的总利润都是负数,说明商品的折扣低于八折就不怎么挣钱了。

总结

2020年销售额随着时间的增加而增长,但是9-12月期间利润没有随着销售额的增长而增长,原因是这段时间内有大量低折扣商品出售。位于东部和西部的几个主要的州(California、New York、Washington等)和几个主要的城市(New York City、Seattle、Los Angeles、Philadelphia等)的销售额较高。50%的客户是个人消费者。0-500美元这个累计消费档次的客户数目最多。大部分客户(80%)一年内购买了1-3次商品。超过一半的客户(57%)选择了费用便宜的标准运输模式。大类中,科技类的产品销售额和利润最高。子类别中,利润方面也主要是科技类的子类别(复印机、电子配件、手机)排名靠前。大部分商品都没有折扣或者打了八折。低于八折的商品的总利润都是负数,因此不建议将商品的折扣设置低于八折。

搜索