新闻中心
我做数据分析的步骤(数据分析技巧)
我们工作中有太多地方需要数据分析了,我说说我实际工作中对于数据分析的步骤吧,算不上标准的方法,就自己的工作方法,或许可以给小伙伴一些参考;
有的时候是产品里已经给分析好了,我们自己不需要额外的去分析,只需要去制定下一步计划即可,比如:
公众号后台的用户分析、内容分析……,我们可以根据后台的数据分析图表,制定接下来的文章类型、推送时间……,以追求更好的效果;
自己产品的后台有数据分析,一般的产品后台至少都有一些简单的统计性数据,比如总用户数、每日新增……而这些是可以让我们去做一些简单的数据分析的,其实在产品初期,借助这些基本是可以满足我们的运营需求;
如果我们使用的是第三方产品,后台有完善的分析数据,这样是没太多必要去额外做分析的;
如果我们是产品初期,也没必要追求复杂的数据分析,因为这个时候产品各种数据量、数据维度可能都不完善,做简单的、粗狂式的分析即可;
但有的时候我们还是需要数据数据分析的,比如用户的反馈分析、用户的调研分析、产品的问题分析、产品的效果分析……,其实各种情况分析的思路都不太相同,但核心是差不多的,我说个大概的思路和步骤吧;
说明:本文稍微有一丢丢长,我本来想最后加一个完整的案例做总结,但一写完发现太多了,就没说这个案例了,不过过程中也有各种场景,可以作为小例子;
01
明确分析目的
这一步很多人觉得想明白了,觉得目的嘛,不就是为了找出问题么,怎么可能不明确呢,但其实很多人没明确,很容易导致数据抽取有问题;怎么说呢,一定要自己去构思清楚,自己要分析的目的是什么,这里面一定要避开“幸存者偏差”,这是非常容易犯的思考错误;关于这一点,我就不多说了,但这是数据分析开始之前的很很很很重要的一个工作,一定要做好;
02
清洗数据
PS.以前读书学编程的时候学的数据处理中有个就是“清洗数据”,我一时半会儿也找不到合适的词语来形容这一步,所以还是用这个词语了;什么是清洗数据呢,就是我们拿到数据后,把那些明显有问题的数据先剔除,比如:
1)重复的数据:
如,分析用户反馈问题的时候,发现同一个用户反馈同一个问题多次,这样的数据就可以剔除了;
2)异常的数据:
如,分析订单数据的时候,发现有一天的某个商品销售量特别高,该商品以前就几个,这一天几百个,后来找研发调后台记录,发现该天有个用户恶意购买并退款,这样的数据也可以剔除;
3)缺失的数据:
如,分析用户调研问题的时候,发现有些回收回来的调研单数据都不完整,就仅仅有姓名、性别,其他的都没填,这样的数据也可以暂时剔除;
但这里也有例外,比如分析调研回收质量效果,就需要这种缺失的调研单,以便看调研回收质量效果,看收回的所有调研单,那些质量不好的调研单是什么类型,就需要保留了,所以还是看分析的目的是啥,具体来看;
经过以上这些呢,基本上就可以把数据做个大概的清洗了,然后再对清洗后的数据做分析;
03
整理数据
在整理数据这一步,不同情况有一丢丢不同,说2个常见的场景吧,比如:
1)分析用户反馈问题时
需要做的整理是依次去标注收集到的反馈,可能有些是用户纯抱怨,有些是用户的建议,有些是用的过程中出现的bug……给定标签和备注说明,去依次标定所有的反馈;
如果这些反馈是我们自己产品后台呢,可能已经在用户填写时做了分类选择,但如果我们是从其他渠道,比如公众号后台、微博留言私信、贴吧等等拿到的用户反馈,就需要我们这样去标注了;
2)分析效果时
一个在线学习网站,上线了一个新课程,上线一周后发现该课程付费转化率不高,为了找到原因,我们需要拿的数据不是成功付费的数据,而是未付费成功的用户数据,从这些数据中找到未成功付费的原因;
先拆解影响成功付费的因素,然后根据拿到的新课程一周的未成功付费的数据,根据数据来依次分类到我们拆解的各个因素中;
网站上用户购买课程总共就2个步骤,提交订单、付款,所以影响成功付费的因素可能是订单提交环节出现问题,或者付款环节出现问题;
从这2个方向看那些未成功付费的用户原因属于哪一类,是订单提交环节的问题,还是付款成功环节的问题;
以上是很常见的两个场景,不一定要我这样整理,自己逻辑说得通就行,也还有其他场景,就不说了;
04
统计问题
根据前面整理的数据,或分类或标注来分析问题,这一步说起来很简单,就把标注或分类的问题再去细化拆解进行统计一下就行了,但也有值得说的地方;
我们首先要想统计的目的是为了帮我们我们制定下一步的行动计划,或是完善功能、或者迭代产品、或是发现问题……因此我们的统计的颗粒度一定要能够给出行动方向才行,不然统计也是白统计;
我们可能统计后发现了不同的问题占比分别是多少,比如用户反馈问题中,用户bug占了10%,用户抱怨占了30%,用户建议占了20%……我们可能无法根据这些数据制定下一步行动计划,所以还得细化分解统计;
就需要将不同问题单独拿出来做统计整理,bug类的问题可能还需要找研发一起来细化统计,哪些是明显的问题,哪些是需要测试介入的,哪些是需要产品介入的,哪些是需要客服回访用户才行的……
用户抱怨类问题也是,可能分为系统性能抱怨,产品抱怨,分别统计出来给研发和产品……
效果分析也是一样,按照这样的方式来细化统计每个大分类下的问题,直到这些问题能够指导行动或明确;
05
优先级排序
有些问题,是需要多个部门一起来看优先级的,至于优先级怎么排,相信不同的团队有不同的考虑,就不说了,自己内部确定好即可;
比如在整理和统计课程未成功付费用户的数据后,发现提交订单环节有3种情况,分别是提交后未付款(35%)、提交订单失败(20%)、未提交订单(45%);
提交订单失败就还需要继续拆解,看失败的原因是什么,然后把原因列举出来找研发一起看,按照怎样的优先级来解决,提交后未付款和未提交订单也是一样,继续拆解,然后列出优先级;
可以马上改的改,优化的优化,可能还有些是现阶段无法解决的,就先搁置着,有些问题是影响较小但投入较大,综合权衡后决定暂时不做改变……
这就是优先级,按照自己部门和公司的各种准则综合来排优先级就行;
06
制定下一步计划
这个也很重要,因为分析后不就是为了制定下一步行动计划么,根据前面的优先级,依次制定下一步的计划即可,就不多说了;
多说几句
里面可能有些步骤是可以同步进行的,没必要非得这样一步一步来,或者完全按照这个来,基本上以上5个步骤是我在分析数据时会用到的大概步骤,大概思路是这样的,其实里面要细说还有很多可以说的,就不啰嗦了;
题图来源:Photo by Isaac N.C. on Unsplash