新闻中心
超级菜鸟怎么学习数据分析?(超级菜鸟第二季)
16年我决定:以数据分析为核心技能,到风口所在的行业去工作。目前我在互联网公司从事数据工作。

之前写过一篇回答:如何快速成为数据分析师?
这篇回答作为“如何快速成为数据分析师”的补充,列举一下数据分析各个模块的学习路径。
数据分析是啥?我将数据分析分成了三种境界:
招式花哨:招式就是分析工具。会 Excel、会 SQL、会 Python、会 Tableau、会 PowerBI 等等,很重要,但是完全不够。换一种说法:掌握分析工具的使用方法,只是成为一名数据分析师的底线。内力雄厚:内力是指数学基础和分析思路。数学基础包括统计概率,机器学习知识等。分析思路是指拿到一个问题,有没有结构化的思维模式。往细了说,熟练使用对比分析、下钻分析、各种分析方法论(漏斗、相关分析、逻辑树、RFM等)。内力是否雄厚决定了你针对一个问题是否有 insight。但是,这还是不够。业务是核心:离开了业务 KPI 和 业务逻辑,你的分析只是空洞的数字,不能给公司带来任何价值。所以,在有招式和内力的前提上,还得拥有业务 sense。或者说,你的数据报告能够打动业务方,才是最关键的。如果你只能告诉业务方本月销售额周同比下降20%,业务人员只会跟你“呵呵哒~”。销售额跟他们的薪资息息相关,他能不知道下降的程度。你得告诉他们:下降多少(what)、下降在哪里、为什么下降(why)、哪里可以上升、怎么做大概率可以上升(so what and how)。
1 - 学招式
招式1:Excel很多数据分析的简历里是不写 Excel 的,但是这不代表 Excel 不要用。实际上在工作中,数据量不大时,临时分析下数据或者画个折线图,Excel 是非常能够提高效率的。
有一定 Excel 使用经验的同学,其实完全可以在工作中遇到问题直接百度或者Google的。如果你时间充裕,也可以看下下面的两本书:
Excel实战技巧精粹 (豆瓣)
这两本书除了 Excel 技巧的讲解,还会有一些案例,以及如何逻辑严谨的去看数。
但是,这两本书内容很多很杂,时间不充裕可以挑重点先看。
重点学会使用:各类函数(IF、Countif、Countifs、SUMIF、SUMIFS、VLOOKUP 等)、透视表、基础绘图(折线图、柱状图、饼图 等)。
其次,也可以听这个课程:
跟王佩丰学Excel视频教程:Excel实战1800分钟 - 网易云课堂
招式2:SQLSQL 语言在数据分析工作中非常重要。目前大部分公司都是将数据存储在数据库中,尤其是互联网公司,每天产生大量数据,数据分析师就从数据库中直接获取自己想要的任何数据(经过授权)来进行分析工作。
学习 SQL 我推荐的方式是刷题,但是刷题也不是盲目的刷,毫无经验的同学最好先静下心来全面学习下基础知识。这就不得不提经典入门书籍:
SQL必知必会(第3版) (豆瓣)


这两本书很入门,也很适合入门。没有很深奥难理解的理论知识,就是教你如何看懂 SQL 语言。
网络教程我一般就看下面这个:
没有繁琐的讲解,只有每个语句如何写,以及案例的例举。
然后,你就可以尝试着开始刷题了,从简单的题型开始,给自己一些信心先。
SQL 刷题网站有:
刷题当然少不了大名鼎鼎的 Leetcode:
题库 - 力扣 (LeetCode)
我之前也写过一些刷题攻略,供参考:
招式3:PythonPython 连续3年成为开发者最想要学习的语言。
2018年起,Python 进入浙江省信息技术高考,山东省最新版的小学教材也加入了 Python 内容。Python 的火爆程度可能大家都有所耳闻。Python 对于数据分析工作者来说,是非常能够提高工作效率的,写一段代码,可以把一些重复的数据报表工作变成敲一遍回车键就完事。
而且,学会了 Python,后面你也可以在分析工作中做一些机器学习算法的开发。
经常有人问我,学习 Python 还是 R语言,很纠结。我是这么回答的:

废话不多说,先上一个大神的教程:
再来一个菜鸟教程:
书籍类的资料也很多,推荐几本:

下面的回答是我当时学习 Python 的过程,可以获取一个 Python 的实战项目代码:
点赞、评论留邮箱地址,我发送一些珍藏资料给你~


市面上有很多可视化的工具,Excel、Python 也可以用来做数据可视化的工作。
一般公司使用的第三方的可视化工具有:Tableau、PowerBI 等,也有很多公司是用的自己开发的可视化工具,比如阿里巴巴就是自主研发的。(说实话这方面我的经验不是很多,只是用过一段时间 PowerBI)
这方面没有搜集到特别好的学习资料,不过有一个经验,就是这类第三方的软件工具,官网都会有很完善的培训教程,也可以加一个对方的销售或者客服人员,拿到一些资料。
2 - 修内力
内力1:数学基础统计概率是数据分析的绝对基础。很多分析方法模型都是建立在统计概率学的基础上的。这也可能是已经工作的你,最难静下心来学习的。

所以,跟之前一样,先给一个入门级别的书,其实里面很多知识都是高中就学过的,帮你复习一遍:

进一步的,可以看一些难一点的书:

这本书是从统计开始向机器学习的知识过渡了。不过对于小白来说,确实有一些难度,阅读顺序可以往后面放放。
出除了蓝宝书,西瓜书也是很出名的:

也有更深奥一些的:

嗯,看不看就随缘吧。
网络课程也有很多讲数学的,墙裂推荐B站上的 3Blue1Brown,用动画讲述数学专业知识,生动形象,有时间可以看看。
还有可汗学院的统计学公开课:
可汗学院公开课:统计学_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
复旦陈纪修老师的数据分析课程:
数学分析 复旦 陈纪修_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
清华大学的数学建模课程:
清华大学 数学建模 课程_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
清华大学出版社出品的在线学习平台:清华大学的文泉课堂免费开放,有很多高质量资源,有兴趣可以去翻翻:
文泉学堂
里面有很多计算机类和数学类的学习资源。
内力2:分析思路Head first 打头阵,这个系列很适合小白入门:


用差评来证明下这本书有多基础(笑cry~)。
如果你不认为自己是“毫无基础的中学生”,那就看这个:

打造你的数据驱动思维模式,此书案例较多,涉及业务范畴比较广。
如果你准备找前端用户增长相关的工作:

这本书是国内的,整本书的框架就是漏斗分析模型,讲的是创业公司的增长之路。
“AARRR”转化漏斗模型,即: Acquisition(获取用户)、Activation(激发活跃)、 Retention(提高留存)、 Revenue(增加收入)、 Referral(传播推荐)也有国外的版本:
增长黑客的理念是这本书最早提出来的,有空也可以看看。
还有关于网站的分析:
最后在推荐一本麦肯锡分析师的经典书籍:
金字塔原理
这本书除了讲解了很经典的金字塔分析方式,还对“演绎”和“归纳”两种分析逻辑有很详细的讲解。
3 - 业务 sense
业务 sense 这一部分太大了。每个人从事的行业不一样,业务模式也都有区别。我就推荐两本我看过的书:
这本书通过小白进入零售企业从0开始学习的视角,讲解了各种数据分析方法如何融入到具体的业务场景中,最终形成数据化管理模型,从而帮助企业提高运营管理能力。教你如何量化目标,如何形成逻辑缜密的说服力。
该书作者在日产公司工作十余载,专门负责为高端决策层提供参考和支持,书中的很多案例都很接地气,适合小白阅读。
这两本书都是零售领域的,主要我一直在这个领域工作。其他行业我暂时没有特别好的建议和经验分享。
4 - 结语
如果看到这一堆书,一堆资料,佷懵。那对于小白来说正常。
可以先点赞、收藏(嘿嘿嘿~~),目前只挑每个模块入门级别的书和资料来看。
而且最好是结合:3个月拿到数据分析offer~ 里的节奏来学习,给你规划好了应该先学什么,后学什么,怎么找数据来实战。
最后说一句:
数据分析是一门跨学科的学科。对于小白来说,这是机遇也是挑战。机遇是说:就算对于科班(数学类专业)出生的朋友来说,也还是要学习IT、所在行业的业务逻辑、分析思路等很多知识;而且数据分析的岗位也会越来越多(数据分析师的前景怎么样?),数据分析(数据分析日常工作做什么:分析+监控+沟通~)的技能在其他岗位上也会越来越被重视。挑战就不多说了,要学习的内容真的多,保持学习的状态很重要。
最后,一如既往的,附上我的数据分析大礼包:
希望投身数据浪潮的盆友,可以看这篇回答:3个月拿到数据分析offer~数据分析师学习清单:超级菜鸟怎么学习数据分析?转行时如何做出下一步选择:如何知道自己喜欢做什么职业?数据分析师日常工作是什么?SQL系列:6000赞实战题目分享:如何学习 SQL 语言?刷题!!!新整理的 SQL 面试题:面试数据分析会遇到的SQL题~不定时更新~PYTHON系列:做到这些就可以精通Python:编程零基础应当如何开始学习 Python?我的零基础 Python 学习经验分享:你是如何自学 Python 的?Python入门案例:什么因素最影响房价?数据分析实战技巧一:如何进行A/B测试数据分析实战技巧二:假设检验入门数据分析实战技巧三:Python 可视化祝大家能够在大数据的浪潮里淘到金子~