新闻中心

想做数据分析师都要学什么?(想做数据分析师都需要学什么)

2023-09-17
浏览次数:
返回列表
目录

下图总结了在不同阶段的数据分析师所需要的专业知识和技能,如果从事技术路线的话,从初级数据分析师到高级数据分析师的技能从简单的统计分析会逐渐上升到算法模型以及人工智能;同样地,如果是走业务路线的话,所需技能也会从简单的取数需求逐渐上升到分析具体业务问题从而提出正确合理的解决方案,辅助业务决策提升其kpi。

想要系统地学习数据分析跟着老师学那是最快的,在这里推荐一个数据分析训练营,涵盖了数据分析所需的所有知识体系,帮助你在数据分析的求职路上更加顺畅!前 IBM 数据分析大咖 3 天实战训练营打工人升职加薪必备立即解锁

一、数据分析常用的思维和方法

不管是高级数据分析师还是初级数据分析师,都应该具备一些数据分析思维,所以首先介绍下在数据分析师过程中常用的几种分析方法和相关的数据思维。

说道数据思维,不得不推荐一下我的新书《数据分析之道——用数据思维指导业务实战》!

数据分析之道:用数据思维指导业务实战(博文视点出品)京东¥53.00去购买

全书数据代码以及实践案例!

数据分析师如何正确的提建议?mp.weixin.qq.com/s/ysO3ISHhnm3-TJF3F7wbFQ

Part 1 常用的统计学指标

下表总结了数据分析常用的统计学指标。

Part 2 基础数据分析方法

一、对比分析

在比较对象具有可比性的前提下,通过对比分析能够很好地反应业务的变化,更好的说明问题,下表总结了常用的几种对比方法。

二、结构分析

不同的构成成分又不一样的增长速度、成本、管理难易程度,分析业务构成有利于抓住重点、差异化运营、达成KPI目标。

Ø 同一事物可以从多个角度分析结构,需要根据分析目标选择合适的结构拆分维度

Ø 需要多层下钻的时候,拆分先后顺序很重要

Ø 结构分析不止看结构,也要看关心的指标在拆分后的表现

三、同期群分析

同期群分析(Cohort Analysis,亦称群组分析

的主要目的是分析相似群体随时间的变化(比如用户的回访)。

时期、群体交叉,得到同期群分析,如各年的新客,在后续各年的小手工线,可以用与预测后续年份的销售趋势。

一张图告诉你,什么是同期群分析。

简书[陈正曦]的《同期群分析》,https://www.jianshu.com/p/145a13355fa1

所谓同期群分析,也就是将用户按初始行为的发生时间进行划分为群组(即同期群),然后:1.对处于相同生命周期阶段的用户进行垂直分析

(横向比较),从而比较得出相似群体随时间

2. 通过比较不同的同期群,可以从总体上看到,应用的表现是否越来越好了。从而验证产品改进是否取得了效果。

用户留存分析

是将用户的留存行为分为:

初始行为:如“首次使用App”、“成功注册”或“第一次产生购买行为”等;

留存行为:可以是用户的任何行为,如产生购买、使用App、分享等;

通过将用户按初始行为的发生时间分组(得到同期群),然后再统计初始行为时间后不同时段内留存行为的发生频次(或其他有意义的计量,比如消费金额)。

该部分参考:简书[陈正曦]的《同期群分析》,同期群分析

四、漏斗分析、路径分析

漏斗,简单来讲,就是抽象网站或APP中的某个流程,观察流程中每一步的转化与流失。对目标的过程要素进行定义,包括阶段划分、阶段升迁标志、阶段升迁率、平均阶段耗时、阶段任务等,形成目标路径,分析升迁路径各阶段的机会和障碍,优化产品,促进目标达成。常见于流量产品分析。

([及策云课堂]的《数据分析卡片(三):漏斗分析》,http://www.woshipm.com/data-analysis/758063.html)

漏斗的三元素

根据漏斗的定义,我们可以抽象出漏斗的三元素:

时间

节点

流量

1.时间

这里的时间,特指漏斗的转化周期,即为完成每一层漏斗所需时间的集合。通常来讲,一个漏斗的转化周期越短越好,尤其是在某些转化周期较长的行业,比如:在线教育行业,B2B电商行业。

此外,单独查看每一层漏斗的时间,也能发现一些问题。举例来说,如果发现从某个渠道导入的流量,在某层漏斗的消耗时间惊人的一致,这说明该渠道的流量很可能有异常。

2.节点

每一层漏斗,就是一个节点。而对于节点来说,最核心的指标就是转化率,公式如下:

转化率 = 通过该层的流量/到达该层的流量

整个漏斗的转化率以及每一层的转化率,可以帮助我们明确优化的方向:找到转化率低的节点,想办法提升它。

3.流量

流量,也就是人群。不同人群在同一个漏斗下的表现情况一定是不一样的,比如淘宝的购物漏斗,男人和女人的转化率不一样,年轻人和老人的转化率也不一样。

通过人群分类,我们可以快速查看特定人群的转化率,更能清晰定位问题。

例如,一家电商网站,从浏览宝贝详情到付款的转化率仅有3.6%。通过创建购买流程的漏斗,分析购买的转化率过低的原因。

([及策云课堂]的《数据分析卡片(三):漏斗分析》,http://www.woshipm.com/data-analysis/758063.html)

该部分参考:[及策云课堂]的《数据分析卡片(三):漏斗分析》,数据分析卡片(三):漏斗分析 | 人人都是产品经理五、聚类分析

聚类分析是根据事物的特征进行归类,以便根据特征去做管理、决策。目的是提升效率、降低成本。换句话说就是将很小的单位聚成几类,所关注的对象量级减少。

前提:特征是用于业务。

人群的特征千千万,单业务有气自己的形态,例如线下的业务不适合用消费者线上行为作为聚类特征。

六、相关分析

相关性是指两个或多个变量之间,它们的波动变化具有一定的一致性。通过这种波动一致性的分析,可以研究变量之间的关联,相关性是最简单的二元组

有相关性并不代表有因果关系,相关性需要柱以及核问题:相关性大小、在什么范围相关、可以揭示的相关性。

以上都是数据分析过程中常用到的分析方法,也就是我们俗称的数据思维。当然管有数据思维还是不够的,因为数据思维是建立在对业务超级熟悉的基础上,就可以通过数据思维解决问题。

想要系统地学习数据分析跟着老师学那是最快的,在这里推荐一个数据分析训练营,涵盖了数据分析所需的所有知识体系,帮助你在数据分析的求职路上更加顺畅!前 IBM 数据分析大咖 3 天实战训练营打工人升职加薪必备立即解锁

其他方法汇总

文章来源:公众号数据万花筒

文章链接:数据思维|总结常用的数据分析思维和分析方法

文章目录结构如下:

1.三大分析思维

2.不同生命周期的分析方法

3.实操案例汇总

掌握常用的数据分析方法论是培养数据分析思维的基础,俗话说“工欲善其事,必先利其器”,而数据分析方法论就是数据分析是最强大的武器之一。这一节会围绕数据分析常用分析方法展开,概括性地介绍数据分析师在日常工作中较为常用的数据分析方法论。

三大分析思维

对比分析,用户分群以及相关性与因果性分析是贯穿数据分析全流程的三大分析思维。如图1所示,三大分析思维包含了不同的分析方法。

图1 三大分析思维概括

没有对比就没有明确的数据结论,对比分析可以衡量数据整体大小,数据波动以及数据变化趋势,所以说对比分析是得出数据结论最简单有效的方法。通常情况下,数据分析师会利用业务数据与大盘数据或者行业金标准数据进行对比,以判断业务现状。除此之外,同比,环比/横比/纵比等也是较为常用的对比分析方法。A/B测试是一类较为特殊的对比分析方法,该方法是数据分析师常用的线上试验的方法,是探究变量间因果关系最行之有效的方法。

用户分群也是贯穿数据分析全链路的分析思维,根据用户的行为数据/消费数据等特征对用户分群是实现用户精细化运营的基础。用户分群可以基于用户历史数据,对数据进行分箱处理形成规则类型的标签,从而根据标签实现用户分群。如果企业的数据标签体系做得好可以直接通过数据标签实现用户的分群。除此之外,用户同期群分析也是用户分群另一种方法,该方法是一种横纵结合的分析方法,在横向上分析同期群随着周期推移而发生的变化,在纵向上分析在生命周期相同阶段的群组之间的差异。当然,数据分析师也可以根据需要使用RFM模型或者K-Means等机器学习算法实现用户分群。

除了对比分析和用户分群之外,相关性与因果性分析也是数据分析师需要具备的第三大分析思维。在变量关系探索的过程中,相关性分析师较为常用的分析方法,但是变量之间存在相关性并不代表它们之间拥有因果性,所以必要时候因果推断也是数据分析师必会的分析方法。

完整文章请查阅数据思维|总结常用的数据分析思维和分析方法

数据思维|总结常用的数据分析思维和分析方法mp.weixin.qq.com/s/kk56ju0ju-7ZfyRXzE6gzA

说到数据思维,其实还是比较抽象的。数据思维是可以慢慢培养的,数据分析师可以从根据数据分析结论提出合理意见和建议开始做起!

数据分析不只是数据的罗列,而是数据和分析的结合。数据层面包括数据获取、整合、可视化等操作;分析侧面则是结合业务目的和数据表现给出相应的数据结论。只要掌握数据工具就能获取、整合数据,而分析问题并给出有效结论和建议就有一定的难度。根据分析结果给出合理的意见和建议是数据思维培养过程中重要的环节之一。本节会立足于如何根据数据表现提出合理建议,通过几个示例说明数据分析师在给出建议时常常出现的误区。

1 数据分析师提出合理建议需要经历的三个阶段

并不是每个数据分析师从刚入行开始就能够通过数据分析为业务方提出合理解决方案,从入门到进阶,数据分析师一般会经历从给数据到给结论再到给观点的转变。那么这三个阶段各有什么异同呢?此处笔者通过一个示例进行说明。

最近某公司新上了一个项目,业务方找到数据分析师,说想要拉取一些数据看一下当前用户黏性。对用户黏性,数据分析师可以通过新老用户的分布、用户留存率等指标进行说明。如图 3-7 所示,对于相同的数据,不同的数据分析师会给出不一样的结果,由浅到深可以分为给数据、给结论、给观点三个不同阶段。

1.给数据

“给数据”是数据分析最初级的阶段,是通过数据陈述客观事实的过程。对于上述用户黏性的例子来说,数据分析师小 A 给出“新业务近一周新用户数累计 300 万个,新用户次日留存率为 65%,七日留存率为 17%”的结果。这样的结果就是一个对客观数据的陈述,是一个“给数据”的过程。理论上这样的结果没有任何错误,但对业务方没有太多帮助。

2.给结论

“给结论”是对数据结果的加工和深入分析并给出结论性的表述。数据分析师小 C 给出的结果就是结论性的表述,“新业务近一周用户总量达到 10000 万个,新用户数累计 300万个,次日留存率为 65%,七日留存率为 17%,新业务的数据表现优于同类业务及行业标准。”数据分析师小 C 给出的结果不仅有对数据事实的陈述,还有结论性的表述,是一个较为典型的“给结论”的例子。

3.给观点

“给观点”是在“给结论”的基础上对数据进行深挖,基于对业务的了解给出一些切实可行的建议。数据分析师小 D 给出的观点是“新业务数据表现优于同类业务及行业标准,特别是渠道 F 用户黏性高且付费率高,建议增加 F 渠道的广告投入”。数据分析师小D 不仅给出了新业务的基础数据,也给出了结论性表述。更重要的是,他通过对用户来源渠道及付费情况进行拆解,发现渠道 F 的用户不仅黏性高而且付费率也不错,于是建议业务方增加渠道 F 的广告投入。

当然,刚入行的数据分析师要做到“给观点”是比较难的,这不仅需要熟练的分析技巧、缜密的数据思维,还需要对业务有极深的了解。但是这并不妨碍刚入行的数据分析师从“给结论”做起,随着对业务的不断熟悉逐渐从“给结论”到“给观点”转变。

2 数据分析师需要避免的几种提建议的方式

如图 3-8 所示,从数据到结论,数据分析师会经历发现问题、分析问题、解决问题三个不同的阶段,在每个阶段提出切实可行的建议都起着关键作用,应避免提出以下几种类型的建议。

1.不明确分析目的,只做简单的数据堆砌

部分初级数据分析师掌握了数据分析工具和相关的基础技能,但是缺乏实操经验和相关业务知识。通常到了提建议环节,可能连业务方具体的问题还没搞明白,就只能拿出统计学方法论做简单的数据堆砌。

例如,数据分析师小 A 给出“新业务近一周新用户数累计 300 万个,新用户次日留存率为 65%,七日留存率为 17%”的结果。

给出这样的数据之后,就没有后续的意见和建议了。这种情况大部分是没有明确需求,即还没有搞清楚业务方想要的到底是什么,业务方现在面临的问题到底是什么,当然没办法继续进行下一步的分析,更别说给业务方一定的建议了。因此,树立目标意识是分析的第一步,要树立目标意识、挖掘潜在的分析点。

需求不明确这种困境一般是由业务方和数据分析师共同造成的,可能业务方在提需求的时候也没说清楚自己真正想要的数据,或者业务方是个“小白”,根本不知道需要看哪些数据或指标;对于数据分析师来说,面对这些不太清晰的需求,也没有问清楚存在的痛点及分析的目标,其实对于这种情况,数据分析师可以基于自己的知识和业务理解提出可行的分析方案。

明确分析目的,进而分析业务问题,是建立在数据分析师对业务有一定了解的基础上的。一般情况下,企业的指标体系就是业务的抽象形态,而大多数问题是可以通过拆解数据指标初步定位的。所以对于刚入行的数据分析师,即使对于业务不是很了解,仍然可以通过指标体系了解业务形态,并在实际工作中不断积累经验。

2.说的都对,却没什么用

说的都对,但确实没什么用,是大部分初级数据分析师提建议时会犯的错误之一。以具体的例子来说,业务方看到最近用户的次日流失率高达 70%,会很着急,过来找数据分析师寻求帮助。而数据分析师却说:“流失率这么高,那你们降低用户流失率啊。”这样的建议是对的,但是对于业务方是没有任何帮助的,业务方也知道需要降低用户流失率,但到底怎么降低,数据分析师并没有从数据层面给出一定的建议。

这类问题,大多数是问题分析不够深入,拆解得不够细致造成的。面对用户流失严重这个问题,业务方找到数据分析师肯定是想要找到什么样的用户流失了,这些用户为什么流失,在哪个环节流失以采取一些针对性的措施。

数据分析师经过较为细致的拆解,可以从渠道、流失步骤等提出以下较为具体的建议:

渠道 A 的用户流失较为严重,而渠道 B 的用户黏性较好,可以考虑减少渠道 A的资源投放,增加渠道 B 的资源投放。流失用户中的 80%在某节点流失,可以考虑排查是否该节点存在技术问题或者不符合用户偏好和使用习惯。

这样提建议,业务方才有着力点,才能从产品侧对业务进行一定的改进,也才是有意义的建议。

3.提出的建议无法落地

除了上述两种情况,提出的意见无法落地也是较为常见的问题。面对用户流失这个问题,数据分析师经过市场分析和竞品分析之后,发现由于相关竞品以低价夺走了部分市场份额,用户随之流失,因此数据分析师建议降低商品售价并与竞品保持一致。

这个建议的确可以减少用户流失,挽回部分用户,但是公司经营涉及成本问题,可能降低售价,利润就微乎其微了。业务方以 KPI 为导向,所以并不会采纳这类意见。

数据分析师这个岗位并不直接参与到业务决策中,就算数据分析师提出合理、切实可行的意见或建议,业务方也不一定采纳。所以这类问题考验的已经不是数据分析师基础的数据分析能力,更多的是其软技能、沟通能力及影响力。数据分析师在提出意见和建议时可以考虑用图表代替文字说明问题,用业务方听得懂的话代替专业术语陈述建议。另外,如果你的建议能够帮助业务方提升 KPI,那么业务方多少会对你的建议感兴趣。当然,从不同的业务出发,从不同的分析角度着手,都能提出各种不同的建议。所以本节只是抛砖引玉,至于如何在不同业务形态中提出合理、可行的建议,就需要数据分析师在实践中积累了。

市面上大部分数据分析相关的书籍都是从工具的介绍开始的,但很多时候数据分析主要依靠数据思维。

特别是面对复杂业务场景时,对于业务的熟悉程度及数据思维显得尤为重要。

想要系统地学习数据分析跟着老师学那是最快的,在这里推荐一个数据分析训练营,涵盖了数据分析所需的所有知识体系,帮助你在数据分析的求职路上更加顺畅!前 IBM 数据分析大咖 3 天实战训练营打工人升职加薪必备立即解锁

二、数据分析工具

如何解决问题呢?当然会用到各种不同的分析工具,如图所示总结了数据分析师在不同阶段应该具备的技能。

由上图可见,Excel,SQL,Python等工具都是数据分析师需要学习和掌握的。因为有了数据思维之后,需要通过一定的工具才能实现相关的思路,所以分析掌握工具也是数据分析师学习过程中重要的一环。

参考链接

搜索