新闻中心

01数据分析—基础知识(数据分析入门基础教程)

2023-11-21
浏览次数:
返回列表

1:什么是数据?

数据是对事物的描述和记录,是信息的具体表现形式;

2: 数据-信息-价值

数据经过加工处理之后成为了 信息;

信息需要经过数字化转变成数据才能存储和传输;

从数据中提取出有价值的信息 ,最终形成结论,并用于决策和支持 ;(数据分析师最核心的工作)

3:数据类型

一、定性数据:表示事物性质、规定事物类别的文字表述性数据;

定类数据:各类别之间是并列关系,没有大小之分,无法进行相关运算(颜色,性别,喜好)

定序数据:数据可以排序,有大小之分,但是无法进行相关运算 (学历,产品等级,年级)

二、定量数据:以数量形式存在的属性、并因此可以对此进行测量;

定距数据:具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,但是不能做乘除运算;

eg:(温度,成绩,年龄)温度0度,不能说我没有温度,所以0代表数值,也是绝对零点的含义,这里需要体会一下子,更直观的是考试0分,你不能说我没有分;

定比数据:数据的最高级,既有测量单位、也有绝对零点、可以进行加减乘除运算,0代表没有

eg:收入,利润,用户

4: 统计指标

一、集中趋势:描述数据的集中趋势,体现数据一般水平的指标

平均值 :各项加和/个数, 平均值代表整体的平均(一般)水平,平均值的缺点: 对异常值敏感 ;中位数 :按照顺序排序后,取中间位置的数,奇数:(n+1)/2 偶数:n/2 ,更具代表性,不受异常值影响; 众数:出现次数最多的数据,众数可以有多个;

二、离散趋势:衡量数据的差异情况

极差:相距最远的两个点之间的距离、即最大值-最小值,反应数据内部最大差异情况;

标准差:数据的波动大小,

平均差:|每个数据项-均值|/ 数据项个数 ,值越大越分散,值越小越集中;

三、分布形态:图表化数据后呈现的形态,常见的分布形态:

1、对称/正态分布(中间高四周低) 2、左偏分布 (左底右高) 3、右偏分布(右底左高)

注意这里的‘偏’指的是离开,这样比较好记。

最近帮部门面试几位数据分析师,发现即使有很多年经验的数分,对数据的基础知识掌握不是很牢固,所以才有了想创作的想法,一方面希望自己创作的内容可以勉强帮助他人,一方面也帮助自己持续学习和总结 ;

搜索