新闻中心
京东手机数据分析(京东大数据分析案例启发)
第一部分 GooSeeker爬取数据
爬取数据也是数据分析比较重要的一环,巧妇难为无米之炊,下面实践的例子是GooSeeker爬取京东商城手机类别前30页数据,然后在后台导入转换成excel格式。由于GooSeeker官网教程很详细,这里大概说下一下翻页爬取列表数据,操作步骤,如下:



小经验:第一次爬取数据看上去好像没什么问题,但是后来检查数据时发现“价格”列很多是空值,可能跟网速,抓取速度有关,我把抓取延时由5设置为40重新爬取一遍数据,没有再出现这个问题。

第二部分 对Excel数据进行分析
经过检查各列计数均为1416,没有空值,下面开始对各列数据进行清洗
(1)隐藏原始数据中无关列,保留"内存"“大小”“商品名称”“价格”“商品来源”“评论”、自动换行与调整列宽、列宽

(2)选中列+shift快捷键,拖动列调整列顺序,并手动修改列名称,此处评论数约等于销量

(3)根据商品名称唯一标识删除重复值

(3)使用分列功能把“销售价格”转换成数值类型

(3)对"销量"用left() find()函数进行截图,把销量转成数值型数据

通过数据—筛选发现销量1万以下的都有#VALUE错误,直接用公式替换回原值

(4)对"销售价格"作描述统计

(5)数据透视表分析



(1)可以看出3GB-6GB运行内存的手机销量偏高,(2)可以看出屏幕尺寸在4.6英寸以上的手机销量偏高,但3.0英寸的也不低,接近230万部,应该是老人机型号起了推动作用。从销售渠道来源看,京东自营渠道的手机销量达到1639万部,而第三方店通过京东物流售出的手机为351万部,(1)(2)都反映出京东自营占了京东商城手机销量的大部分份额。(3)可以看出占主流手机市场的手机价格都在600到2000之间。