新闻中心

第三站——数据分析岗位分析(Excel篇)(数据分析人员工作内容)

2023-05-15
浏览次数:
返回列表

本次将利用Excel对数据分析岗位进行分析,步骤如下:

一 提出问题

1) 根据学历的不同,数据分析师的需求量是怎样变化的?

2) 根据工作经验的不同,数据分析师的需求量及薪资是怎样变化的?

二 理解数据

2-1数据分析岗位信息列表

以上数据是利用某爬虫工具从某招聘网站中爬取的武汉区域与数据分析岗位招聘相关的3554条数据,。数据包括职位名称、薪资、工作地点、工作经验、学历、福利、公司名称、公司性质、公司规模。

三 数据清洗

在对数据进行操作前,最好先把原数据复制一份另存,然后在后来的数据中进行相关的操作,这样万一中途你想重新操作也毫无影响。另外为了保留数据的完整性,最好也不要轻易删掉数据。

1选择子集

将暂时不需要的列选择隐藏,保留职位名称、薪资、工作经验、学历、公司性质、规模。

2列名重命名

对数据区域的列名可以根据需要进行重命名,这里暂时不修改列名。

3删除重复值

3-1数据删除重复值操作

选中整个数据源,选择“数据”菜单-“删除重复值”功能进行相应操作后点击“确定”按钮。删除306条重复值,保留了3247条数据。

4缺失值处理

比较每一列的数据量,查看是否有缺失值,然后找到缺失值并对它进行处理。这里我所爬取的数据没有缺失值就可以跳过这一步不用进行呢任何操作。但是如果碰到了,处理缺失值一般有以下4种方法,根据情况灵活使用:

1)通过人工手动补全,适合于缺失值比较少的情况

2)删除缺失的数据 (一般尽可能不删除数据)

3)用平均值代替缺失值

4)用统计模型计算出的值去代替缺失值

5)数据一致化处理

3-2数据一致化处理

上图2-1我们就看到职位名称和工作地点里包含多个格式,这会影响分析结果,需要对他们进行一致化处理。另外为了后续分析便利,对薪资利用函数求出最低薪资、最高薪资、平均薪资。并检查这三列中是否存在错误值,并对其进行相应操作。最后按平均薪资进行排序。其中利用函数Left()、FIND()、MID()、LEN()函数。

6异常值处理

6-1数据异常值处理

对职位中不属于数据分析师的异常值进行处理然后复制到新的工作表。应用函数为

IF(COUNT(FIND({"数据分析","分析师","数据运营"},B2)),"是","否")

四 构建模型及数据可视化

1根据学历的不同,数据分析师的需求量是怎样变化的?

2根据工作经验的不同,数据分析师的需求量及薪资是怎样变化的?

通过上面的分析,我们可以得到的以下分析结论有:

(1)对于武汉区域数据分析岗位来说,大专、本科学历的需求量还是挺大的。

(2) 对于从工作经验来分析来看,5-10年工作经验薪资最高,其次3-5年。数据分析岗位的薪资是一个随着工作经验的提升而增加的。且市场上对于1-3年、3-5年的需求量也是挺大的。

五 总结

进行数据清洗后导致样本只有120条,样本不足使数据分析结论可能存在偏差。后面我将对于在工作中遇到的数据进行分析实践,帮助自己更有效的做好工作。另外将接着学习统计概率及Excel各功能,完善知识体系。

搜索