新闻中心
如何成为一个初级分析数据师(初级怎样才能考过中级呢)
1. 统计学
统计学也是我们后面进行很多分析的基础,那么统计部分主要分为三大模块,首先第一个模块就是描述性统计,那么这一点有助于帮助我们那到一个数据集的时候可以进行初步的描述分析,在描述统计当中,需要掌握的比较概念就包括均值,中位数,众数,方差,极大值以及小值除此之外我们还需要了解整体的数据分布,那么在数据分布当中,主要的数据分布就包括正态分布,伯努利分布,二项分布,均匀分布,泊松分布以及指数分布同时均值和中位数的比较还直接决定了这个数据集分布的偏度以及峰度,最后我们还需要去识别数据集当中缺失值以及异常值.
2. 假设检验
第二个模块就是在假设检验中,我们必须要掌握原假设以及备择假设定义同时还有检验的几种主流方法,比如T检验以及卡方检验,那么为了解释假设检验的结果,我们所需要掌握的概念就包括p值置信度以及置信区间,在实际工作中假设检验的一个主要运用就是ab实验,所以我们就需要掌握和ab实验相关的知识点。
3. 概率论
第三个模块就是概率论,在这个模块当中一定要掌握的内容就包括条件概率的计算,抽样方法,大数定律,中心极限定理,区间估计R²以及方差分析。
数据分析的工具
1、数据处理工具:Excel
数据分析师,在有些公司也会有数据产品经理、数据挖掘工程师等等。他们最初级最主要的工具就是Excel。有些公司也会涉及到像Visio,Xmind、PPT等设计图标数据分析方面的高级技巧。数据分析师是一个需要拥有较强综合能力的岗位,因此,在有些互联网公司仍然需要数据透视表演练、Vision跨职能流程图演练、Xmind项目计划导图演练、PPT高级动画技巧等。
2、数据库:MySQL
Excel如果能够玩的很转,能胜任一部分数据量不是很大的公司。但是基于Excel处理数据能力有限,如果想胜任中型的互联网公司中数据分析岗位还是比较困难。因此需要学会数据库技术,一般Mysql。你需要了解MySQL管理工具的使用以及数据库的基本操作;数据表的基本操作、MySQL的数据类型和运算符、MySQL函数、查询语句、存储过程与函数、触发程序以及视图等。比较高阶的需要学习MySQL的备份和恢复;熟悉完整的MySQL数据系统开发流程。
3、数据可视化:Tableau & Echarts
如果说前面2条是数据处理的技术,那么在如今“颜值为王”的现在,如何将数据展现得更好看,让别人更愿意看,这也是一个技术活。好比公司领导让你对某一个项目得研究成果做汇报,那么你不可能给他看单纯的数据一样,你需要让数据更直观,甚至更美观
4、大数据分析:SPSS & Python& HiveSQL 等
如果说Excel是“轻数据处理工具”,Mysql是“中型数据处理工具”那么,大数据分析,涉及的面就非常广泛,技术点涉及的也比较多。这也就是为什么目前互联网公司年薪百万重金难求大数据分析师的原因
想要深入了解可以多关注和联系我哦,带你一起挖掘数据!