新闻中心
【定义篇】100个纯干货知识点助你从零建立起完整的数据分析体系(定义和解释的区别)
1
为什么需要数据分析体系
不是说只有数据产品经理才需要懂数据!
公司在运营的过程中具体需要一个什么样的数据支撑服务呢?
在很多不成熟的公司中,虽然也有使用数据去验证产品的思路,但是他们在实际工作中往往是这样取用数据的:
产品同学找到数据分析师,问他昨天刚上线的版本,用户点击率是多少。运营同学找到数据分析师,问他前两天上线的拉新活动是否带来了用户量的增加。领导找到数据分析师,问他这两天的订单量是否有所增长,上月交易额环比增长是多少。因为各个岗位都会有自己的数据需求,所以数据分析师只能挨个儿地进行数据计算。
由于人力资源有限,数据分析师往往无法及时反馈所有的数据需求,这将会导致一些运营活动或产品规划错过最佳的时机,例如,在双11前夕想要准备双11促销活动,却迟迟拿不到过往的运营活动数据。
正是基于这样那样的原因,很多企业演化出了一类数据产品——数据仪表盘,如图3-1所示。

图3-1 数据仪表盘
也就是将各个数据需求方常关注的数据做在一张报表中,这样大家就可以在这里统一看到整个产品的用户数、交易数等数据变化,在一定程度上就轻松满足了大家对数据的需求。
但是随之而来的新问题如下:
产品同学抱怨:虽然看到昨天新上的版本中用户转化率下跌了,但是根本看不出来原因是什么,说不定是运营同学的活动导致的。运营同学抱怨:我虽然看到了拉新数,但我有三个用户拉新渠道,到底哪个拉新渠道的拉新能力最强,带来的用户质量最高呢?面对这样的进阶需求,此时就需要一套完整的数据分析体系来做支撑,进而来帮助我们掌握数据变化情况以及快速定位变化背后的原因。
在完全没有数据分析背景的前提下,如何实现从需求分析到方案设计?本篇将完整搭建数据分析体系全过程。
2
数据体系100个核心知识点速查索引
为了方便大家学习与在工作中速查对应内容,我将过往的经历中涉及到的100个数据体系定义,公式与案例都汇聚成共计100个知识点,写至《高阶产品经理必修课》一书中。

这里我将知识点摘录出来,以方便大家可以快速查找对应内容。以下为全书知识点看板:
一级分类二级分类序号范围知识点数知识点总数定义数据体系1~181839运营模型19~268增长模型27~359企业模型36~394公式数据体系1~111127运营模型12~198增长模型20~267企业模型271案例数据体系0~171834运营模型18~236增长模型24~3310表附录-1 知识点看板
定义类(39个)
出处:第三章第二节(书中章节名)
【定义1:软系统】
任意一个体系要想发挥正确价值,必须要分为产品与使用者这两部分,这两者合二为一称之为软系统。
出处:第三章第二节
【定义2:数据分析体系】
数据分析体系 = 数据分析平台 + 数据使用者的分析模型
出处:第四章第二节
【定义3:产品生命周期理论】
产品生命周期理论是由美国哈佛大学教授雷蒙德·弗农(Raymond Vernon)在1966年在其《产品周期中的国际投资与国际贸易》一文中首次提出,将产品的完整周期划分为由生到死的四个阶段。
出处:第四章第二节
【定义4:产品用户划分】
(1)访问用户:指每日产品UV,能够直接反应产品的受欢迎程度;
(2)新增用户:新增用户反映了产品的发展速度与推广效果;
(3)活跃用户:此类用户是产品真正掌握的用户,只有活跃用户才能为产品带来价值;
(4)流失用户:根据产品定义时间周期,满足周期未访问的用户就可称为流失用户;
(5)挽回用户:通过产品召回,使部分用户再次返回产品中来。
出处:第四章第三节
【定义5:硅谷设计理论——注意力博弈理论】
注意力博弈(The Attention Game):用户在你的产品中花费了多少时间;
交易量博弈(The Transaction Game):用户在你的产品中产生了多少交易量;
创造力博弈(The Productivity Game):用户在你的产品中创造了多少高价值的内容。
出处:第四章第四节
【定义6:数据平台核心服务】
(1)描述分析服务:通过数据确定当前业务的现状是什么样的,在企业建设初期必须要建设,从而帮助企业者确定企业运营总体成效。本类分析最常见的产出就是数据报表。
(2)成因分析服务:通过数据确定当前业务现状的背后是什么因素造成的,如用户下单量不高,此时背后的原因是什么?
(3)预测分析服务:通过找到现象与成因,慢慢的我们就可以建立起预测模型,来预测下一次同类型事件发生时的可能性结果,例如通过收集过往活动促销数据,来预测双十一订单数据,从而提前备货。
出处:第五章第三节
【定义7:数据参考系】
本概念是一个用来反映公司业务基准线的事物,它标志了业务的平均水平是什么样子,而当我们的单位时间内的数据超过这个基准的时候,就真正意味着我们的业务处于增长态势,反之就属于业务衰退态势。
出处:第五章第三节
【定义8:同比/环比】
(1)同比:非连续时段下,某个周期的时段与过去上一周期的相同时段比较,如:今年Q3季度交易额与去年Q3季度交易额对比;
(2)环比:两个连续时段下,某个时段与时长相等的上一个历史时段比较,如:本周订单量与上周订单量对比;
出处:第五章第五节
【定义9:基于数据仓库的数据处理体系】
一般来说基于数据仓库的数据处理体系改造后会分为三个层级,分别是ODS层、CDM层与ADS层,分别解决数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三类问题,如图5-3所示。

图附录-1 基于数据仓库的数据处理体系
出处:第五章第六节
【定义10:维度表(dimension)与事实表(fact table)】
(1)维度表:记录以需要观察的角度进行展开的要素信息,如使用时间维度,观察商品要素为:年,月,日,时,分,秒;
(2)事实表:记录不同维度要求下具体事件的全量信息,包含每个事件的具体要素,如时间,用户ID,购买商品ID,支付单ID;
出处:第六章第一节
【定义11:指标】指标具体指一组能反映某一业务在单位时间内的规模、程度、比例的数字。
出处:第六章第一节
【定义12:指标分类】
(1)产品概要类指标:用于评价产品现阶段整体情况概览;
(2)产品流量类指标:用于评价产品内用户的数量与质量;
(3)客户价值类指标:用于评价产品的盈利状况与可持续性。
出处:第六章第三节
【定义13:指标体系】多个指标以一定的逻辑组合成的能反应当前业务问题,并定位问题背后原因的指标集合。
出处:第七章第四节
【定义14:OSM分析框架(Obejective,Strategy,Measurement)】

图附录-2 OSM分析框架
O(Obejective):用户使用本功能的目标是什么?该满足了用户的什么需求?
S(Strategy):为了达成上述目标,我们采取的业务策略是什么?
M(Measurement):这些策略与之对应的数据指标都有哪些?
出处:第八章第二节
【定义15:数据采集方式】
(1)非透明采集:指看不到原始数据,只能通过统计上报采集,常见的方法如:埋点:
(2)透明采集:对业务线中现有的系统数据库进行直接数据提取,如日志服务器数据的整理抽取,POS机的交易数据库中对订单数据抽取。
出处:第八章第四节
【定义16:埋点】又称事件追踪(Event Tracking) 指通过针对特定标识用户的行为或事件进行捕获,处理与传输的全流程实施过程。
出处:第九章第一节
【定义17:实体商家交易漏斗模型】

图附录-3 实体商家交易漏斗模型
(1)客量:一家店铺是否有足够的到店消费客户,这是一切的前提,而这里客户又细分为两个类型:
①浏览客量:指那些来店只看不消费的人;
②有效客量:指到店真正消费的人;
(2)业绩:又称之为营业收入,指的是账面流水(包含成本)。
(3)利润:刨除成本后店铺的最终收入。
出处:第十章第一节
【定义18:数据驱动业务决策框架】数据驱动业务决策框架就是:如何根据当前的数据识别并发现产品问题予以解决与发现业务短板予以提升,具体分为两部分
(1)日常运营:通过数据分析定位产品问题,保证平稳运行;
(2)黑客增长:通过数据分析发现业务短板,实现业绩增长;
出处:第十章第二节
【定义19:描述类数据分析模型集】
序号模型适用场景1数据看板为高层提供业务运行查看2趋势比对(同比/环比)帮助业务运营者发现业务运行中的数据问题3指标分析模型解决具体看板内的需求与解决部分原因性问题判断表附录-1 描述类数据分析模型集

出处:第十章第二节
【定义20:成因类数据分析模型集】
序号模型适用场景1用户标签模型宏观维度:确定用户的消费画像,分析用户行为背后原因2留存曲线模型宏观维度:定义周期内产品留存情况分析3用户召回模型宏观维度:对流失用户进行召回,从而降低用户流失4转化漏斗模型微观维度:交易链路等核心步骤场景5杜邦分析模型微观维度:针对高度概要类指标(如GMV)变化时细分具体原因表附录-2 成因类数据分析模型集
出处:第十章第二节
【定义21:增长类数据分析模型集】
序号模型适用场景1用户分层模型产品步入成熟期拥有大量用户,其中包含多类特征鲜明的用户群2RFM模型分析用户购买行为确定对公司价值最高的用户从而进行精细化运营3渠道价值分析模型分析流量渠道,寻找ROI最大价值渠道4归因分析模型微观维度:拆解问题背后导致的因素5AARRR增长模型以增长视角来驱动产品各环节迭代升级6NPS推荐值模型判断产品在用户群体中认知与价值7A/B Test分析模型对关键环节的产品方案比对,确定效果最优方案表附录-3 增长类数据分析模型集
出处:第十一章第三节
【定义22:用户流失】指定时间周期内历史用户不再登陆本应用,这部分历史用户称之为已流失用户。
出处:第十一章第三节
【定义23:留存率】某段时间新增用户数,在单位时间波动后,该群用户中继续使用本产品的用户数占原新增用户数的比例。
出处:第十一章第三节
【定义24:留存渐进线】产品留存率最终维持在一个水平线上,这一水平线称之为留存渐进线,如图11-5所示。
出处:第十一章第四节
【定义25:数据事件】数据事件是追踪或记录的用户行为或业务过程,使用一组指标组成的对特定用户行为的体系监测的原因。
出处:第十一章第四节
【定义26:漏斗分析模型】通过监控一个用户任务中从起点到终点各个环节用户的数量以及转化情况,从而定位到流失较大的环节,接下来去寻找每个环节的可优化点。
出处:第十二章第一节
【定义27:黑客增长(Growth Hacking)】这一概念最早是由美国 Sean Ellis 提出的,指的是一家公司团队在数据分析基础上,利用产品或技术手段来获取自发增长的运营手段。
出处:第十二章第四节
【定义28:角色演进路线图】
所谓角色演进路线图就是我们希望用户在产品中完成对应的任务以及成为对应的角色,通常情况下,产品中通用的角色演进路线如图附录-3所示。

图附录-4 通用角色演进路线
出处:第十二章第四节
【定义29:RFM模型】RFM模型是20世纪中叶在美国黄页业务中发明的一种用户精细化分层方法,企业可以把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度进行分类。
出处:第十二章第五节
【定义30:首次互动模型分析法(First Model)】将后续渠道的触发转化归功于消费者第一次互动的渠道。
出处:第十二章第五节
【定义31:最终互动模型分析法(Last Model)】将销售转化归功于消费者最后一次互动的渠道,与首次互动模型不同的是,最终互动计算是以成交作为一次计数判断。
出处:第十二章第五节
【定义32:线性归因模型分析法】将转化归功于消费者接触的所有路径,罗列销售转化路径,平均分配贡献权重。
出处:第十二章第六节
【定义33:AARRR模型】AARRR的含义是Acquisition、Activation、Retention、Revenue、Refer这个五个单词的缩写,分别对应用户生命周期中的5个重要环节:
(1)用户获取:追求目标:自然新增量,渠道;
(2)提高活跃度:追求目标:日活,月活;
(3)提高留存率:追求目标:次日留率,7日留存率,月留存率;
(4)获取收入:追求目标:成单转化率,付费率;
(5)自传播:追求目标:转发数,评价数。
出处:第十二章第六节
【定义34:NPS模型】NPS推荐值模型,英文全称Net Promoter Score,最早由贝恩咨询公司的创始人弗雷德在2003年提出,NPS的作用就是能够帮助我们直接反映用户对产品的喜爱度是多少。
出处:第十三章第二节
【定义35:第一次悖论】这是数据分析中最常见的一个悖论,众所周知数据驱动运营需要依赖于数据分析的结果,但是在第一次设计对应运营活动时,我们往往是没有该类活动的效果数据。此时就陷入到一个悖论:没有数据的情况下如何能做出最优解。
出处:第十四章第一节
【定义36:企业战略规划】简称企业战略(Enterprise Strategy),指的是企业为达成特定的商业目标而定义的一系列企业执行动作的集合。
出处:第十五章第二节
【定义37:企业成立因素】
l需求侧:该产品不能是个性化需求,需要有一定规模潜在用户;
l供给侧:该产品/服务有可以规模化与标准化提供的生产形式。
出处:第十五章第二节
【定义38:企业的本质】
l不断在市场中寻找愿意为企业产品/服务付费的新用户,拓展需求侧;
l通过创造并组织生产要素,使用户需求能规模化生产,解决供给侧。
出处:第十五章第三节
【定义39:企业增长生命周期】
整个企业增长周期可以分为 5 个匹配点:
(1)问题的解决方案匹配(PSF):真正挖掘到目标市场的痛点并能产出解决方案;
(2)产品与市场匹配(PMF):创造能解决目标市场痛点的可规模化解决方案产品;
(3)渠道和产品匹配(CPF):寻找能低成本且快速推广的渠道帮助产品推向市场;
(4)企业与市场匹配(EMF):在不断开拓市场中,不断调整企业结构以适应发展;
(5)下一个增长周期。
以上数据知识点的更详细介绍,以及完整应用可以去看我的《高阶产品经理必修课》一书。
