新闻中心
01数据分析—基础知识(数据分析入门基础教程)
1:什么是数据?
数据是对事物的描述和记录,是信息的具体表现形式;
2: 数据-信息-价值
数据经过加工处理之后成为了 信息;
信息需要经过数字化转变成数据才能存储和传输;
从数据中提取出有价值的信息 ,最终形成结论,并用于决策和支持 ;(数据分析师最核心的工作)
3:数据类型
一、定性数据:表示事物性质、规定事物类别的文字表述性数据;
定类数据:各类别之间是并列关系,没有大小之分,无法进行相关运算(颜色,性别,喜好)
定序数据:数据可以排序,有大小之分,但是无法进行相关运算 (学历,产品等级,年级)
二、定量数据:以数量形式存在的属性、并因此可以对此进行测量;
定距数据:具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,但是不能做乘除运算;
eg:(温度,成绩,年龄)温度0度,不能说我没有温度,所以0代表数值,也是绝对零点的含义,这里需要体会一下子,更直观的是考试0分,你不能说我没有分;
定比数据:数据的最高级,既有测量单位、也有绝对零点、可以进行加减乘除运算,0代表没有
eg:收入,利润,用户
4: 统计指标
一、集中趋势:描述数据的集中趋势,体现数据一般水平的指标
平均值 :各项加和/个数, 平均值代表整体的平均(一般)水平,平均值的缺点: 对异常值敏感 ;中位数 :按照顺序排序后,取中间位置的数,奇数:(n+1)/2 偶数:n/2 ,更具代表性,不受异常值影响; 众数:出现次数最多的数据,众数可以有多个;二、离散趋势:衡量数据的差异情况
极差:相距最远的两个点之间的距离、即最大值-最小值,反应数据内部最大差异情况;
标准差:数据的波动大小,
平均差:|每个数据项-均值|/ 数据项个数 ,值越大越分散,值越小越集中;
三、分布形态:图表化数据后呈现的形态,常见的分布形态:
1、对称/正态分布(中间高四周低) 2、左偏分布 (左底右高) 3、右偏分布(右底左高)
注意这里的‘偏’指的是离开,这样比较好记。
最近帮部门面试几位数据分析师,发现即使有很多年经验的数分,对数据的基础知识掌握不是很牢固,所以才有了想创作的想法,一方面希望自己创作的内容可以勉强帮助他人,一方面也帮助自己持续学习和总结 ;