新闻中心
数据分析就业前景分析(数据分析就业前景分析怎么写)
一、分析目的
1、数据分析师当前的岗位招聘要求;
2、数据分析类工作当前的行业分布;
3、数据分析师的职业的发展情况;
二、数据来源
数据来自招聘网站爬虫,由猴子老师提供。
三、数据分析步骤
(一)理解数据
目的:查看数据信息,理解数据/字段含义。
数据集1.76MB,CSV格式,共计6874条数据,因本次主要对职位进行分析,将职位ID作为表格主键。公司名称、公司ID、公司简称3个字段均为描述公司的字段,字段重复,隐藏公司名称、公司ID。


(二)列名重命名
目的:将含有外文、特殊字符等的列名重命名为中文、常用名称方便分析。
操作方法:查看表格字段,均为中文字段,不用对列名进行英文转中文等重命名操作。
(三)数据清洗:重复值处理
目的:对数据集的主键 “职位ID”做删除重复值处理
操作方法:
1、选中数据区域-功能区-数据-删除重复项-取消全选-选择职位ID列-确定

1、选中数据区域-功能区-数据-筛选-高级-选择不重复的记录-确定

3、对重复项的处理也可通过函数实现。需要通过函数计算职位ID列每个职位出现的次数,同时,为了方便筛选,职位ID出现的次数从上至下分别按照“1,2…”依次排序。由此,采用countif函数,并对列向下绝对引用。通过筛选功能,去掉筛选计算结果非1的行。
(函数为:=COUNTIF(J2:J$5032,J2))

(四)数据清洗:缺失值处理
目的:真实的反映总体数据的情况,缩小偏差
处理方法:
对于缺失值,一般有以下处理方法:
①删除缺失值,适用于小样本情况;
②人工手动补全数据,适用于小样本情况;
③插补缺失值,如平均值,统计模型计算值(同类均值、极大似然估计)插补。
操作方法:
数据集去重后有5031条数据,在理解数据的时候,已经发现缺失值出现在城市列;缺失两个值,可通过手工补全的方式补充。除此之外,可通过选择数据区域-“CTEL+G”快捷键输出定位-定位条件-定位空值-确定-在空白单元格输入等于上一行-按CTRL+ENETER
补全空值。



(五)数据清洗:一致化处理
1、用筛选功能查看字段,公司所属领域列存在一个公司多个领域的情况,后期会,在公司所属领域后插入新列,命名为公司所属领域2,使用数据栏-分列-分隔符号-逗号进行分列。

2、查看职位名称列,除了职位分析岗位外,还有数据系统工程师、大数据算法工程师等岗位,我们需要通过函数,过滤出列名数据分析、数据运营、分析师相关的岗位。
公式1:=IF(OR(COUNTIF(M2,"*"&{"数据分析","数据运营","分析师"}&"*")),1,"0")
公式2:=IF(COUNT(FIND({"数据分析","数据运营","分析师"},M2)),1,"0")
筛选结果为1的数据集。
3、查看薪水列,薪水爬取的是一个区间,不是具体值。为方便分析,我们可以通过数据分列功能,分列出最高和最低薪水,然后通过求取平均薪水。也可以通过文本查找函数查找出最高和最低薪水。
①最低薪水:公式:=LEFT(N2,FIND("k",N2,1)-1)

使用公式后,通过筛选功能查找到有运用公式不成功的,原因是薪水的K为大写,通过替换功能将K替换为小写的k。
②最高薪水:公式=MID(N2,FIND("-",N2,1)+1,LEN(N2)-FIND("-",N2,1)-1)

使用公式后,通过筛选功能查找运用公式后的结果,发现运用公司不成功的,是在录入时将薪资写成15K以上的,将最高薪水统一等于最低薪水。
③将计算后的最高薪水和最低薪水值统一处理成常规格式,然后运用AVERAGE函数求平均值。
四、数据分析
通过以上步骤,数据清洗已加工完毕,下面开始对数据进行进本分析。下图总结了数据分析的一般方法。

(一)描述性分析
描述分析方法:数据-数据分析-描述统计-确定
箱型图方法:插入-图表-全部图表-箱型图



结论:数据分析师的众数是15K,平均薪资14K左右,北京和深圳的分析师薪资差异较大。
(二)数据分析师岗位需求分析
经验维度:


学历维度

结论:数据分析师需求最大的城市分别是一线的北上广深,接着是杭州和成都。一线城市数据分析师岗位较多,占全部13个城市需求量70%以上,仅北京就占整体需求的46%。1-3年,和3-5年的缺口需求较大,从现在开始转型不晚。招聘时,学历要求最多的是本科以上。本科以上更容易通过公司的招聘门槛。
(三)数据分析类工作当前的行业分布

结论:数据分析师岗位需求量最大的行业是移动互联网、金融、电子商务,占岗位需求75%以上,如需转型,可考虑先从移动互联网、金融、电子商务行业找工作。如在这3个行业已有沉淀,这3个行业就业形势较好,可继续在行业发展,提升自己的专业技能。
(四)数据分析师的职业的发展情况
平均薪水
总结:一线城市的平均工资较高。分析师的平均薪资主要集中在6K-17K左右,19K以上应该是经验5年以上的薪资分布。可以看出随着经验的增加,数据分析师的薪资是增加的。
注意事项:
1、此次分析是实操练习,老师已提供相关数据。但数据分析师应在理解业务的基础上,提出问题,然后再采集数据进行分析。需避免成为业务部门的取数分析师。
2、养成良好的操作习惯,原始数据一定要备份,以便后续对数据检查;每个小的分析步骤完成后,需保存数据,以防因意外情况发生后要重新开始处理数据;保存操作痕迹,如函数公式,为便于后期复盘。
3、操作时,多余的字段不要删除,可隐藏,以便后期复盘。
4、数据的清洗或称数据预处理,一般情况下会清洗数据集里面的无效值、重复值、缺失值;查看数据是否有乱码、错位的现象;如有多张表,是否有统一的数据口径。经过清洗后的数据在进行数据转化,将数据规整为统一格式处理。
5、以下是总结的步骤和方法: