新闻中心
一个月,从小白变成月薪3W的高级数据分析师(高级数据分析证书含金量高吗)
成为一名数据分析师绝对不是你想象中那么容易。
在正式开始之前,你可以先看看自己处于哪种状态:
1. 没有数据基础,但是对于数据行业非常感兴趣
2. 有数据基础,未来希望踏入数据行业事实上,无论有没有数据基础,如果你想未来从事数据分析师这一行业的话,都需要了解以下内容:
一. 什么是数据分析师?
数据分析师(Data Analyst)是数据师(Datician)的一种,指的是在不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
数据分析最主要的结论是利用数据去解决一些商业性的问题,那数据分析师的职责,一定是收集数据,分析数据,对于商业的问题做出一些指导性的意见。
那作为一名专业的数据分析师,需要怎样的思路?
一名数据分析师,必须具有数据思维的思路,必须了解你所负责的项目的商业背景,当你非常了解这些背景之后,才能给出具有指导意义的建议。
举个例子来看,不同品类的复购周期,消费频次等,是需要深入了解之后才能知道背景信息,然后去进行更多的分析的。这是数据分析师都必须具备的商业知识和思维。
如果大家想要成为数据分析师的话,刺猬建议你应该先了解一下数据分析师每天都在做什么。
二. 数据分析师每天都在做什么?
1. 60%的时间——规整data
大家可能会以为数据分析师大多数的时间都在研究数据公式或者代码,其实不是,他们只是在处理一些不规则的data。
这些不规则的data来源于不同的地方,像是互联网的data会比较规范一些,他们有自己的数据库,但是中间会有一些奇怪的data,虽然很少,但是也是需要去处理的。
如果不是互联网的行业,很多甲方的资料都是不规整的,每个部门都有自己的规范,有些是存在数据库,有些是Excel。
那其实当数据分析师做数据分析的时候,甲方是直接把这些data丢过来的,他们不会关心自己的data有没有规范。
那么整理数据的整个步骤就是数据分析师的工作,所以数据分析师花费的时间是在规整这些资料,他们把这些data处理成可用语言工具去处理的资料或格式。
规整这些资料就占了他们60%的时间,其他的时间才会去进行一些分析或建模,找寻数据之间的一些规律。
这样看来,大家之前认为数据分析师会建立算法,探索数据,并进行预测分析,其实这些都不是他们花大部分时间做的事情。
2. 数据分析师工作时间的分配
那数据分析师们到底把他们的时间花在了什么地方?刺猬带大家来看看:
Building training sets:3%Cleaning and organizing data:60%Collecting data sets:19%Mining data for pattern:9%Refining algorithms:4%Other:5%数据分析师一般是这样处理的:
问题识别:当这个项目进来后,他们需要去了解背景,知道甲方需要解决什么样的问题,这是一个项目的核心;数据检查:数据导入后需要去了解这些数据;数据清理和操作:利用这些数据去计算以及创造出新的变量,以供以后做后续的分析,去处理数据的异常值;建模及数据可视化。当数据规整后,数据分析师们会进行一些描述性的统计,但你可能对描述型统计还不太了解。
给大家举个例子,我们要统计一/二/三四线城市一个年龄阶段,男女生的消费情况,得出一些结论。(例如是男生消费更多还是女生消费更多?是哪些城市的消费支出会更高?)
那这个结论怎么得出来的呢,作为数据分析师,是不可能直觉性的知道一线城市的女生/男生消费支出更高。
但他们需要朝着这个目标去分析,一定是先把这个数据拉出来,男生、女生、一二三四线的数据比列全部拉出来进行分析才会发现规律,然后再把各个维度都拿去做检查以及计算。
其实描述性的统计并不难,加减乘除就能完成,但是在其中最重要的是,是需要去了解和找寻数据中间的规律和新的发现,去解决问题。
当数据清理完毕后,就会进行建模/机器学习,做出可视化的效果。
这里,刺猬简单地给大家看几个常见的模型:
当数据分析师得到的整体数据都是比较散乱的时候,就会利用算法进行聚类,分析哪一些可以被计算为一个群体。
同时,他们也可以利用数据分析去判断和辨别假冒伪劣产品/金融诈骗,以及去分析网络的评论。举个例子,当一个歌手在微博上发新歌的时候,就会进行网络评论的数据分析,分析新歌的走向等等。
3. 数据分析师的工作内容
Leader会告诉数据分析师去看一下data是怎么样的,你需要去清理data;会进行一些描述性的统计,类似简单的数学去找其中的规律;建模,解决一些描述性统计没有办法解决的部分。三. 数据分析师应该具备的技能
那如果你是数据分析小白,应该如何提升数据能力呢?
1. 必须学习好基础能力
统计知识建模语言:R、Excel、SQL、Python2. 实战经历
角色:收集、处理、进行统计数据分析
思维:弄清楚直观数据的结论
语言:R,Python,HTML,Java,C/C+,SQL
技能:
电子表格工具(Excel)数据库系统(SQL and NO SQL based)沟通&可视化数学&统计学&机器学习在技能方面,最基本的一定是Excel,很多数据分析师会想说:我会了Python就不用学习Excel了。
其实不是这样的,Excel存在了这么长的时间还是现在使用频率非常高的工具,这是有原因的。在处理小数据上,Excel绝对占优势,毕竟很多工作最后的呈现方式是PPT or Excel。
所以对于数据分析师来说,Excel绝对是必备的工具,你必须非常了解Excel里的一些功能,比如公式、函数等。
在语言方面;如果所在的公司是有自己的数据库,那你必须得会SQL,SQL是一个从数据库里面拉数的一个语言,所以SQL一定是具备的,当我们的的数据拉出来后,我们就会用到像Python这样的语言工具,它的作用是可以把数据进行可视化,呈现在大家面前。
成为一名高级数据分析师没有那么容易,但也没有想象中的难。只要你用心学习,并且抽出时间、找对方法,从小白进阶为高级数据分析师,你也可以!
刺猬大学,成就青年人的职业梦想。更多精彩内容,请关注号“刺猬大学”,定期分享职场干货、技能学习、能力提升相关内容。