新闻中心

Wish平台夏季女装销售数据分析报告(wish服装)

2023-12-19
浏览次数:
返回列表

项目代码见:

满拉阿卜:Wish平台夏季女装销售数据分析项目(代码)(上)3 赞同 · 3 评论文章满拉阿卜:Wish平台夏季女装销售数据分析项目(代码)(下)6 赞同 · 2 评论文章

一、分析背景

这是一份来源于kaggle的数据集,它搜集了Wish网站上2020年8月关于夏季女装的数据。Wish是一个属于综合网上商城模式的双边市场平台,它类似于“天猫商城”。这种类型的电子商务网站本身是不销售商品的,主要提供商家销售商品的平台和服务,每个商家在这个网络“百货商场”里面交一定的租金就可以开始销售商品。

通过加工、处理、分析这些搜集到的数据,希望解决以下几个问题:

1.消费者偏好的夏季女装有哪些特点?

2.消费者对价格变动敏感吗?

3.了解Wish平台夏季女装物流和库存的基本情况。

4.哪些因素对销量影响较大?

5.找出预测销量的最好算法,通过该算法帮助我们合理化库存,降低成本。

二、字段说明

该数据集共有1573条数据,43个字段。数据量不大,但对于这个项目来说,能满足分析需求;43个字段比较丰富,可以挖掘不少有用信息。下面我们对数据集的字段做一些简单的介绍说明。

三、数据分析

我们采用营销学中著名的“4P理论”对这个数据集进行分析,4P营销理论被归结为四个基本策略的组合,即产品(Product)、价格(Price)、渠道(Place)、促销(Promotion)。

3.1 产品分析

产品是市场营销组合中的首要因素,也是最为重要的因素。企业在营销活动中,时刻要以满足消费者和市场需求为中心,而消费者和市场需求的满足必须依靠产品来实现。

3.1.1 产品的基本信息

从图中可以看到,爬取数据的时间为“2020年8月”,查看theme(主题)字段,都为“summer”(夏季)内容,这两点符合我们要分析的目标对象,即夏季女装。

3.1.2 服装色彩情况

色彩是服装的重要属性,用色彩来装饰自身是人类最冲动、最原始的本能,无论古代还是现在,色彩在服饰审美中都有着举足轻重的作用。它是服装的核心要素之一,是塑造品牌服装的有效手段。色彩在服装设计中极为重要,它将决定一件衣服是否会吸引消费者的注意。而且女性追求漂亮,对服装的色彩搭配更为看重。

各种颜色女装的平均销量

从图中可以看出,橙色、灰色、紫色女装的平均销量是最高的,都在6000以上,而多色调、粉色和黄色则销量最低,只有3000上下。

服装色彩的喜好与文化、季节、肤色、性别等因素都有关系。

橙色是红和黄的混合色,是火焰的颜色,与红色相比更让感到欢快,象征着华丽、朝气、精神、跃动、欢快;紫色在自然界中十分稀少,故而显得珍贵而神秘,常使人联想到庄严、神秘、深远、崇高、神圣、天国、高贵、优雅等。

这两种颜色都比较符合女性气质,橙色适合青春有朝气的女性,而紫色适合成熟性感的职场女性。灰色比较平凡,可以搭配大部分颜色的衣服,而且属于浅色,适合夏季。而多色调容易让人眼花缭乱,给不舒服的感觉。

商家进货时,应确保颜色品类齐全,同时多进符合女性特质的如橙色、紫色等颜色的衣服。

3.1.3 服装尺码情况

尺码是表示人体外形及服装量度的一系列规格参数,是为了规范厂商生产及方便顾客选购而形成的一套量度指数。

各个尺码女装在市场上的占比

从图中可以看出,S、XS、M三款尺码的女装在市场中所占比重是最高的,分别占比45%、23%、13%,这三种中小尺寸的女装总共占比81%,占据了市场的绝大多数份额。而XXL、XL、L、XXS占比很低,总共占比13%。

因为女性的身材骨架相对小,而且女性爱美、追求苗条身材,所以小款和中款比较受欢迎。

店家进货时,应少进极小或极大的尺码,多进中间的尺码,采用“枣核型”进货方式。而且应针对不同年龄购置不同尺寸的女装,一般针对年轻女性购置小款女装,中老年购置中大款。

3.1.4 服装标签情况

我们使用词云图来对服装标签进行展示。词云是对海量文字内容中出现频率较高的“关键词”的视觉突出,即出现越多的“关键词”,字体越大,是展示关键词的一种重要方式。

夏季女装标签的词云

通过分析词云可知,women fashion(女性时尚)、plus size(加大码)、short sleeve(短袖)、casual women(休闲女装)、dress women(连衣裙)、sexy(性感)、tank top(坎肩)是高频词。

短袖、连衣裙、坎肩这些清爽的服装受到消费者偏爱,符合夏季的特点,此外时尚、性感也是女性的一大追求。店家应紧跟潮流,进行进货,同时在标签中突出这些高频词,以获得更多推荐流量。

总结:

① 从服装颜色来看,橙色、紫色、灰色的夏季女装更受法国消费者偏爱,而黄色、粉色、多色调则销量有限。

② 从服装尺码来看,S、XS、M这种能够凸显女性身材的尺码更受消费者偏爱。

③ 从服装标签来看,短袖、连衣裙、坎肩这些凉爽服装受到女性喜爱,时尚、潮流、性感也是女性的一大追求。

④ 商家应按性别(女性)、地域(法国)、职业(年轻学生和职场白领)、消费文化等因素对市场进行细分,有针对性地销售。

3.2 价格分析

价格是市场营销组合中的重要因素之一。在现代市场营销活动中,价格是一个十分敏感而又难以控制的因素。价格定得过高会限制消费者的购买,但是价格定得过低又会影响企业的盈利。可见,定价是企业从事市场营销活动中的重要决策之一。

3.2.1 结算货币

通过查看currency_buyer(结算货币)字段的数据,可以发现该列都是“欧元”,我们的服装是在法国售卖,所以使用欧元进行消费。目前汇率:1欧元=7.9482人民币。

3.2.2原价和现价的对比

retail_price(原价)即服装的吊牌价,price(现价)即消费者实际购买服装的价格。

retail_price和price的函数分布对比

可以看到:retail_price(原价)和price(现价)的函数分布都是右偏的,但retail_price右偏程度更高。此外,retail_price(原价)更平缓,有不少极端值,而price(现价)的分布更集中。

经过调整后的实际价格更集中,即店家确定某一个最容易让消费者接受的区间为价格区,在该点附近提供更多可选的产品,以增强竞争力。

price和retail_price的累积分布函数对比

从retail_price(原价)的CDF图中可以看到,70%左右的零售价分布在25欧元内,15%分布在25-50欧元之间,剩下15%的分布在50欧元以外。

从price(现价)的CDF图中可以看到,70%左右的现价分布在10欧元内,15%以内的商品的价格分布在10-20欧元之间。

说明Wish平台的店家主要经营10欧元以内的中低档女装,可以发现大体上现价比原价在价位上要低一级。

retail_price和price的箱形图对比

从retail_price(原价)的箱形图可以看出,最小值为1,最大值为252,价格带宽度为251;其中第一四分位数是7,中位数是10,第三四分位数是26,upper fence是54。

从price(现价)的箱形图可以看出,最小值为1,最大值是18,价格带宽度为17;第一四分位数是5.8,中位数是8,第三四分位数是11,有一个异常值为49。

很明显,现价比原价低,而且原价更分散。

3.2.3 折扣情况

打折是重要的营销手段,折扣定价策略主要是指商品生产经营者为了广泛扩大产品销路,争取顾客,刺激销售,对购买者给予一定的优惠。

为了进一步分析夏季女装的价格情况,我们新增加了几个有关折扣的变量:

discount_amt:retail_price - price 表示降价多少

discount_amt_range:bins → 0,10,20,30,40,50 降价范围

discount_percentage:(retail_price - price) / retail_price *100 折扣率

discount_prct_range:bins → -20,-10, 0, 10,...,100折扣率范围

降价范围折扣率范围

从降价范围图表中可以看到,不管是涨价还是降价,10元以内的小幅价格调整是最普遍的;存在一定的涨价现象,但只涨了10元以内;而降价现象则普遍多了,在0-80元之间都有广泛分布,甚至存在一些百元以上的大幅降价现象。

从折扣率范围图表中可以看到,存在一定的涨价现象,但涨价的幅度不高,只有20%以内;而降价则很普遍,而且降幅很大,0-100%的降幅区间都有分布。

总结:

① Wish上的店家销售的夏季女装大部分是10欧元以内的是中低档价位女装。

② 存在一定涨价现象,但降价更普遍,而且降价幅度更大。

③ 折扣是店家普遍采用的一种营销策略,便宜的服装不一定能大卖,制定一个能让消费者产生一种占便宜心理的价位才是销售成功的关键。

3.3 渠道分析

分销渠道也是市场营销组合中的一个重要元素。企业的产品只有到达消费者手中才是现实的产品,才能实现其价值,在现代市场经济条件下,产品主要是通过营销中间机构的经营活动,才得以实现在适当的时间、按适当的价格和数量,送达到适当地点的目标顾客。

3.3.1 产地情况

夏季女装原产国

可以看到,中国是Wish夏季女装的主要原产国,占了产地的绝大部分份额,Wish夏季女装由中国生产,运往法国销售。

3.3.2 库存情况

库存是渠道分析的重要内容,应确定合理的存货定额,使商品存储保持在适当的水平,既不发生缺货断档,又不发生存货积压。

总库存和产品变体库存情况

从图中可知,各个店家的inventory_total(库存合计)几乎都为50,而product_variation_inventory(产品变体库存)则有一定分散度,需要进一步分析。

为了进一步分析,我们新增一个二值变量is_successful(销售是否成功),以销量1000(中位数)为界,大于1000认定为销售成功,用1表示;小于1000认定为销售不成功,用0表示。

从图中可以看出,销售不成功的女装要比成功的占比高(接近两倍),销售成功率为33.66%。

然后我们以变量is_successful为划分依据,对比销售成功与否的变体库存差别。

销售成功与否的产品变体库存区别

从小提琴图中可以看到,女装的变体库存在40—60区间中,销售成功的宽度大于销售不成功的,而在0—10区间中,销售成功的宽度小于销售不成功的。可见变体库存数量与销售成功有正相关关系,变体库存越多,越有可能销售成功;但也有可能是因为销售的多,所以才采购了更多的变体。

3.3.3 运输物流情况

物流是分销渠道的重要功能成分。制造商在其渠道设计与管理中,必须考虑如何通过物流系统解决其产品实体的运输、储存、养护等一系列问题,选择能保证将产品实体安全、高效、低费用送达目标市场的最佳方式。

运输物流情况

注:左上图为运输价格选项、右上图为是否为快运、左下图为送往的国家数目条形图、右下图为运往的国家数目小提琴图。

从左上图中可以看出,大部分服装的运输价格为1-3元,销售成功与否在这点上没多大区别。

从右上图中可以看出,绝大多数服装没有快运,这点不影响销售成功与否。

从左下图和右下图来看,运送国家数目最普遍是20—60个,特别是40个是最普遍的,推测主要运输国家是欧洲(45国)或欧盟(27国)或发达经济体(25国)。

此外,在运往国家数目这一指标上,销售成功(代码1)的小提琴图比销售不成功的小提琴图中部更长,但总体上区别不大,说明运输国家数目这一字段对销售成功与否影响不显著。

总结:

① Wish上的服装绝大部分生产自中国,然后在法国销售。

② 销售成功的服装往往有更高的变体存货。店家应确定合理的存货定额,使商品存储保持在适当的水平,既不发生缺货断档,又不发生存货积压。

③ 大部分女装选择1-3元运输费用,普遍没有快运服务。大部分女装可以运往40—60个国家,且销售成功的女装能够提供运往更多国家的服务。

④ 企业可以通过改进实体分配,加强物流管理,提供更佳服务或降低成本来吸引更多的顾客,提高顾客满意程度。

3.4 促销分析

促销是指店家利用各种方法把服装的信息传达给相关顾客,以帮助顾客认识商品所能给他们带来的利益,引起顾客的注意和兴趣,激起购买欲望,扩大服装的销路。

3.4.1价格对销量有影响吗?

从图中可以看出,大部分点落在20欧元以内的价格区间,价格越低,销售越多,两者呈正相关关系。但也存在一些特殊情况,价格低的商品,销量并不高,可能决定销量的还有其他因素。另外,可以发现这个数据集中销量是一个离散值,而不是连续值。

3.4.2评分对销量有影响吗?

平均评分分布图

可以看到,平均评分分布函数大体上呈左偏分布,大部分评分集中于3-4.5区间,5分(满分)也占了一定比重。

retail_price(原价)和平均评分的关系

从图可以看出,大部分点集中于3-4.5分和0-25欧元这两个区间重合的区域; 3-4.5分和25-100欧元这两个区间重合的区域也有一些分布;其他区域只有少量点分布。

评分和销量有正相关关系,高评分有助于销售成功。因此店家可以采取多种手段来促使消费者多评高分。

3.4.3 广告对销量有影响吗?

从这张图表可以看出,是否使用广告对销量、原价、评分的影响都很微弱,这看起来有点反直觉。虽然打广告对销量有正面效应,但同时广告费用提升了成本,提高了服装的价格,具有负面效应,两种效应相抵消,所以对各个变量影响微弱。

3.4.4 徽章对销量有影响吗?

徽章情况分析

注:左上图为徽章数目统计、右上图为是否为本地徽章、左下图为是否有产品质量徽章、右下图为是否有快运徽章。

从左上图可知,大部分女装没有徽章,但销售成功的女装更有可能有徽章。

从右上图可知,几乎所有女装都没有本地产品徽章,由上面的分析,我们已知女装主要产自中美,在法国售卖,自然产品没有本地徽章了。

从左下图可知,大部分女装没有质量标志,但销售成功的女装更有可能拥有这一徽章,说明商品质量徽章有助于销售成功。

从右下图可知,几乎所有女装都没有快运徽章,这和前面物流情况分析一致。

3.4.5 其他因素对销量有影响吗?

为了分析这一问题,我们作了所有变量之间的热力图,分析各个变量两两之间的相关关系。我们主要关注其他因素对销量(units_sold)的影响,所以把该列用蓝色边框圈住,并截取了热力图的重要部分。

各个变量和销量之间关系的热力图

从这几张图表中可以看到,商品评分和店家评分都是影响商品销量的最重要的因素,此外徽章数量、库存、折扣都对销售成功有正面贡献;而使用广告、运输价格对销量有负面影响,这个前面已经分析过了。有紧急标识的商品销量低,可能是因为有紧急标识的商品本身存在一定的滞销问题。

总结:

① 价格是影响销量的重要因素,价格越低,销量也越高。

② 评分也是影响销量的重要因素,采取一定激励和提醒措施,让消费者多评分、给好评是促进销量的重要因素。

③ 在Wish网站中,广告和使用紧急标识对销量的促进作用不明显,甚至存在微弱的负面效应。

④通过促销,可以提供信息情报;激发欲望,扩大需求;突出产品特点,建立产品形象;维护和扩大企业的市场份额。

四、销量预测

销售预测是销售管理非常重要的一环,也是做计划、管理、预算和目标的基础。通过对历史数据的分析预测未来一段时间内企业可能产生的销售额、销售量或订单金额等。通过销售预测能得到未来关于目标的预测数值,该预测值既可以用于评估相应的资源投入,也可以针对性的做商品销售策划。

我们把数据集划分为测试集和训练集,80%的数据用于训练模型,20%用于测试。将销量设定为因变量(Y),其它变量设定为自变量(X),使用8种算法对数据进行拟合,通过比较Accuracy Mean(分类准确率)来确定对于该项目最好的算法。8种算法的分类准确率如下:

对Random Forest(随机森林算法)进行参数调优,找出分类准确率最高n_estimators为71,分类准确率达到最高水平,因此,对于本项目最好的算法是Random Forest

代码见:

搜索