新闻中心
数据分析之路-数据可视化(数据分析及可视化什么意思)
数据可视化主要是借助于图形化手段,清晰有效地传达与沟通信息。一个好的可视化,能够带给人们不仅仅是视觉上的冲击,还能够揭示蕴含在数据中的规律和道理。
数据可视化基本常用图表有以下4种:
散点图:适用于观察两个变量之间的相关性;
折线图:观察时间对数据变化的趋势;
柱状图:用于显示数据量的大小;
条形图:看出一组或者多组数据之间的对比。
上一章我们已完成数据清洗和数据分析,接下来我们用数据可视化,来进一步展示得出来的结论。
一、各个时间段商品销量情况,走势如何
·从下图可以看出2014年商品销量是最高,其中第四度季占比全年最高;其次是2013年,同样是第四季度占比最高,下面可进一步分析第四季度销量增长原因。
·观察到2012年与2015年只有部分季度数据,后面就不对比分析。

·观察2013年和2014年,同一年每个季度销量是呈增长趋势;2014年各个季度相比2013年都有所提升,尤其第四季度增幅比较大,接下来我们来看看原因。

·在2014年第四季度中,11月13号销量是最高,在之前11月11日也有一个小高峰,结合这个时间段正好是双十一促销活动,用户购物欲望比较大,促进了第四季度销量大幅增长。

二、哪类商品销量最多,其中最受欢迎前三商品是那些?
·一级分类中28品类销量最多;其中前三商品分别是20409520643、3920805463和9716351898。


·二级分类中50018831品类销量最多;其中前三商品分别是39769942518、19199313057和16383996535,有意思的是从图表看出39769942518商品销量远远大于其他商品,撑起了整个50018831品类销量。


三、不同年龄段购买商品需求怎样
·下图可看出“0-3岁”是主要消费人群,销量占比与人数占比都比其他年龄段高出不少。由于在“7-10岁”销量与人数都占比都很少,下面就不做分析。

·“0-3岁”对50014815品类商品需求最大;“未出生”是50014815;“3-4岁”是50008168;“5-6岁”是50008168。可见50014815和50008168在消费人群中有很大需求。

四、不同性别购买商品的偏好
·购买商品人数女性占比是最高,但跟男性对比相差其实不是很大。
·在销量上女性占比也是最高,差不多是男性的两倍,妥妥主力军。

·女性对50014815需求最大;而男性是50008168,;未知性别对问题没多大帮助,就不做分析。

通过分析看出女性是整个婴儿用品销量主力人群,对50014815和50008168这两品类有很大需求,同时结合上面年龄分析,同样大部分主力人群“未出生-6岁”对50014815和50008168需求也很大,因此在业务上可对其重点推广,有利于进一步提升整体销量。