新闻中心
数据分析之招聘数据(招聘数据分析官网高端)
背景:
随着互联网与传统行业的联系越来越紧密,对数据分析人才的需求也与日俱增。为了更好了解数据分析岗位的招聘信息,帮助求职者更快找到合适工作,以及各企业更好找到符合需求的员工,现对招聘信息进行数据分析。
数据内容:某网站2017年数据分析岗位的招聘数据(包含5千多条数据)
1.明确问题
招聘企业有什么特点?对求职人员有什么偏好?该职位的薪酬水平如何?
2.理解数据
首先将数据源备份,在副本上进行数据处理。表中17个字段,譬如companyId(公司ID)、companyShortName(公司简称)等字段本次分析并不需要,隐藏无用字段后剩余字段的含义为:
City:城市
companySize:公司规模
firstType:岗位类型
education:教育背景
industryField;所在行业
salary:薪酬
worKYear:工作年限
3.数据清洗
3.1选择子集
此处不用操作。
3.2列名重命名
数据源列名为英文,直观看不方便,将每个列名更名为中文名。

3.3删除重复值
根据全字段删除重复值。
3.4缺失值处理
先对数据进行筛选,然后依次查看各个字段下的本文筛选选项,若发现里面有空白选项,将其剔除。最后将筛选的数据全部复制到新建表格。
3.5一致化处理
薪酬字段是一个比较重要的参数,查看数据,发现其不是单一数值,包括一个区间范围,某数值以上和某数值以下。其中薪酬一般没有出现某数值以下,将其整条记录去掉。通过替换操作将K换成K,通过find,left,len,mid函数,将区间范围分为最小值和最大值两列,然后取其平均值作为薪酬,通过替换操作将以上和以下替换掉,将其作为薪酬(其单位K表示千)。通过查看所在行业字段发现,其数据中包含中文格式下的逗号和顿号,英文格式下的逗号以及空格,通过替换将中英文格式下的逗号和顿号统一表示为英文逗号,通过trim,substitute函数将空格去掉。
3.6异常值处理
3.7数据排序
4.数据分析
4.1招聘企业有什么特点?
城市分布:
通过透视表和透视图可以发现,城市排名前5名城市中,岗位需求最多的城市是北京,占总数的47%,说明北京对数据分析岗位的需求很大。接下来依次是上海、深圳、杭州和广州,这完全与城市经济发展状况相对应。而且城市排名前3名均来自一线城市,说明经济越发达的城市,企业对数据分析岗位需求越多。

公司规模:
从各公司规模占比的透视图可以发现,规模在2000人以上的公司对数据分析岗位的需求最多,其次是150-500人和500-2000人,三者加起来占72%。说明大中企业对数据分析岗位更有需求。

所在行业:

由于所在行业字段的数据有160多个分类,大多字段不止一个标签,存在行业交叉,也有行业下的小分类标签,因此只截取了其中排名靠前的数据,从中也能看出绝大部分企业的数据分析岗位与互联网有关。对所在行业字段进行互联网的标签筛选,得到总计2775条数据,占总数的55%,这与前面的猜想一致。
4.2对求职人员有什么偏好?
学历:

通过以上透视图可知:岗位最低要求最多的教育背景是本科,需求占比达76%,排名第二的为大专,才12%,,两者相差很大,说明招聘公司偏爱教育背景至少本科的求职人员。即使从3个一线城市分析,也可以得到类似的结论。说明目前大多公司的数据分析岗位对学历要求比较高,一般至少本科。
年限:

从透视图可以看出,岗位要求的工作年限为3~5年和1~3年数量排名第一和第二,两者占总数的70%,说明企业更喜欢招聘工作年限为1~3和3~5年的求职人员。
岗位:

从以上透视图可以看出,企业提供的岗位大多是技术类型,占48%,说明大多数的数据分析岗位偏向于技术方面。
4.3该职位的薪酬水平如何?
薪酬:

为了便于计算,平均薪酬省去了单位K(千)。通过上诉透视表可以看出,3个一线城市的平均薪酬位列前三,其中平均薪酬最高的城市是北京18.68K,最低是天津8.25K,最高薪酬是最低薪酬的2.26倍,说明城市平均薪酬的差异比较大。但仔细分析,各城市数据分析岗位的平均薪酬相对本地经济水平来说都还不错。

通过透视表可以看出,工作年限对数据分析岗位的薪酬有很大影响,工作年限越长,数据分析岗位的薪酬越大。其中平均薪酬最高的年限是10年以上,高达37.17K,最低的是应届毕业生7.16K,最高薪酬是最低薪酬的5.19倍,说明不同年限的平均薪酬的差异很大,这也可以看出数据分析岗位的职业前景很好。
对于求职者来说,最看重的是薪酬。因此分组选出北京、上海和深圳的招聘数据,分别进行教育背景和工作年限两个维度上的比较。
教育背景:

通过透视表可以看出,上海城市博士的平均薪酬低于硕士和本科,与其他两个城市情况不同,说明数据有误。从纵向上看,北京和深圳的平均薪酬排名一样,都是博士最高,大专最低,符合实际情况。从横向上比较,除了博士,其他学历在三个城市的平均薪酬相差不大。
工作年限:

通过透视表可以看出,三个城市都有同样的规律,工作年限越大,其平均薪酬越多。10年以上的平均薪酬,三个城市还是有一定差异,北京高达43.13K,上海为35K,深圳为30.8K。而三个城市的应届毕业生的平均薪酬差异不大。
5.建议
数据分析岗位的发展前景好,薪酬水平相对不错。对于已经从事数据分析的伙伴来说,若想提高薪酬,可提升学历。对于不在一线城市发展的伙伴来说,可去一线城市就业,也可高薪酬。对于希望从事数据分析的伙伴,最好去经济发达的城市工作,如一线城市,因为那里的就业机会多,薪酬更高。对于应届毕业生或者无数据分析经验的伙伴,若想从事数据分析,则需面对更多的就业压力,薪酬普遍较低。对于学历不高的伙伴,若想从事数据分析,也需面对更多的就业压力,薪酬普遍较低。不过随着工作年限的增加,薪酬的提高幅度还是蛮大的,但同时要求的能力也更高。