新闻中心

数据人必会的Excel|连Excel透视表都不会,别说你会数据分析!(excel数据透视分析怎么做)

2023-11-19
浏览次数:
返回列表

来源:公众号数据万花筒

链接:数据人必会的Excel|连Excel透视表都不会,别说你会数据分析!

坚持写作两年,我的第一本书《数据分析之道——用数据思维指导业务实战》正式出版啦!

数据分析之道:用数据思维指导业务实战(博文视点出品)京东¥53.00去购买

点击上方 蓝字 关注我们

已经使用各类函数统计出了数据结果,却被要求加入新的临时需求。这是数据分析师的工作日常,你是否还在为此苦恼?

面对这样场景数据分析师如何破局?Excel中的数据透视表可谓是数据分析师们的得力助手,学会Excel的数据透视表能够让数据分析师们高效地进行数据统计汇总、字段计算、更新数据源等操作。Excel数据透视表解决了数据统计汇总时效率低且容易出错的问题,能够帮助分析师们高效地完成各类数据统计分析工作。切片器还能实现动态筛选,是不是很酷啊!

今天,我们会以Kaggle平台上经典的Titanic数据集是为例,讲解数据透视表的用法并对该数据集做一个简单的数据统计分析。

01 数据集字段介绍

Titanic数据集包括10个特征,也就是我们所说的字段,分别是乘客是否存活、仓位、性别、年龄、同行的兄弟姐妹数量、同行的长辈数量、票号、票额、仓号以及出发口岸。具体的示例以及含义详见下表。

02 创建数据透视表

创建透视表的方法很简单,我们首先选中需要创建透视表的数据,点击【插入】选项卡下面的【数据透视表】,然后选择放置数据透视表的位置上,最后点击确定,即可插入数据透视表。

当然我们也需要了解下数据透视表的四大基本要素。

字段列表:也就是我们在插入透视表之前所选中的数据内容所包含的字段,可以通过勾选把不同的字段放到筛选框、行、列、值当中。

筛选:需要进行分组的字段,也相当于所谓的filter

列:列值。

行:行值。

值:看具体要统计什么内容。可以根据需要选择统计的方式,例如,求和、计数、求均值等等。

例如,我们现在想要分析仓位与生存的关系,我们可以把字段Survived放在列,把Parch放在行,然后统计PassengerID的个数。

这字段列表左下角有一个延迟布局更新的功能,当数据量较大时,就可以选定这个延迟更新,该功能相当于需要等我们的字段设置完成之后才进行数据更新,可以最大程度保证我们操作的流畅。

值得统计方式默认是【求和】,我们需要进行调整将其调整为【计数】,选中需要调整的数据,单击鼠标右键,点击【值汇总依据】,然后选择【计数】,其调整方法如下图所示。

如果我们单纯看一个绝对数值,得到的信息会比较少,如果我们可以得到不同仓位的生存率和死亡率,可以更加清晰地分析出每个仓位的生存情况。

说到这里你可能都想直接去算百分比了,别着急,强大的透视表当然不会少了这个功能的。我们只需要选择需要调整格式的数据区域,点击鼠标左键,选择【显示值方式】,点击【行汇总的百分比】即可变为百分比格式。

透视表除了可以选择【行汇总的百分比】之外,还有多种形式可以选择,例如,【差异】、【差异百分比】等等,可以根据自己的需要选择相应的计算方式。

03 创建数据透视图以及切片器

原始数据总是会显得不那么直观,要是能有图就更好了。强大的Excel几乎可以满足你的愿望,我们可以选择创建数据透视图。其创建方式也是及其简单的,首先,选中已经有的透视表,点击【插入】选项卡,找到【图表】菜单下的【数据透视图】即可完成创建。

同样的,数据透视图也有四要素,和透视表类似,这里就不在叙述。

有了图,要是能有个筛选器当然再好不过了。只要点击【插入】选项卡下【筛选器】菜单里的【切片器】并选择需要作为filter的字段,我们这里选择的是Pclass仓位作为filter。

04 数据透视表的其他功能介绍

数据透视表除了上述介绍的功能之外,还几个比较常用且非常实用的功能。

第一个就是计算字段,计算字段极大扩展了数据透视表的计算功能。比如我们现在已知每位乘客的同行长辈数量和同辈数量,需要计算每乘客的同行人数,就可以通过【插入计算字段】计算得出,非常方便使用。具体的操作方法详见下图。

除此之外呢,更改数据源也是一个非常常用的功能,该功能可以随时随地进行数据源的更改。其操作方式也比较简单,在【分析】菜单中找到【更改数据源】即可操作。

05 透视表分析泰坦尼克号数据特征

了解了透视表和透视图的用法,我们一起来分析下坦塔尼克号数据集的特征吧!通过数据可视化分析,我们发现头等舱的乘客存活率较高,从C口岸登船的乘客存活率较高。接着,我们分析了登船口岸和仓位的关系,发现从C口岸登船的乘客乘坐头等舱的比率较高,这又印证了头等舱的乘客存活率较高的结论。后面我们分析性别和生存率的关系,发现女性存活下来的可能性较大。

最后,我们分析了同行的同辈数量和长辈数量与生存率之间的关系,发现当乘客同行的父母及子女数量适中时,生存率较高。

当然,分析相关性还可以选择用热力图来表示各个特征之间的相关性,这里旨在分享Excel数据透视表和透视图的用法,就不再赘述其他。

原始数据领取方式

数据人必会的Excel|连Excel透视表都不会,别说你会数据分析!mp.weixin.qq.com/s/iM8hKxbUq1Yty9DWK_LeMA

数据分析师除了掌握数据分析工具之外,拥有数据思维也是极为重要的。

数据分析师这个岗位并不直接参与到业务决策中,就算数据分析师提出合理、切实可行的意见或建议,业务方也不一定采纳。所以这类问题考验的已经不是数据分析师基础的数据分析能力,更多的是其软技能、沟通能力及影响力。数据分析师在提出意见和建议时可以考虑用图表代替文字说明问题,用业务方听得懂的话代替专业术语陈述建议。另外,如果你的建议能够帮助业务方提升 KPI,那么业务方多少会对你的建议感兴趣。当然,从不同的业务出发,从不同的分析角度着手,都能提出各种不同的建议。所以本节只是抛砖引玉,至于如何在不同业务形态中提出合理、可行的建议,就需要数据分析师在实践中积累了。

市面上大部分数据分析相关的书籍都是从工具的介绍开始的,但很多时候数据分析主要依靠数据思维。

特别是面对复杂业务场景时,对于业务的熟悉程度及数据思维显得尤为重要。

因为数据思维决定了分析问题的角度及合理性,只要数据分析师能够针对特定问题提出分析方案,无论用什么工具都可以得到结果,因此数据思维是数据分析师成长进阶路上的必修课。

而市面上关于数据思维的书籍较少且部分书籍讲授的知识点较浅,能够将数据思维、编程语言、统计学思想及案例分析等融为一体的书籍少之又少,强烈给大家推荐这本以数据分析全流程为主线的数据思维的书——《数据分析之道——用数据思维指导业务实战》

数据分析之道:用数据思维指导业务实战(博文视点出品)京东¥53.00去购买

附上全书的目录,本书围绕数据思维展开,一共11章内容。

参考文章

https://www.zhihu.com/question/28048089/answer/742720983

https://zhuanlan.zhihu.com/p/26498531

https://zhuanlan.zhihu.com/p/50194676

https://mp.weixin.qq.com/s/__e9ZX2tpZls7U1_KVST5g

如果您觉得我们的文章还不错,请分享,点赞,再看,一键三连!!!

END

Excel也能完爆BI工具,仅6个步骤就能制作动态炫酷看板

据思维|方法论太干,不如来看5W2H分析流失用户实例

数据埋点|六个步骤实现数据埋点方案设计

数据埋点|从隐私保护浅谈数据生命周期,初识数据埋点

指标体系|入职新公司如何为新业务搭建一套通用的指标体系并快速实现指标体系落地

数据分析师在数据治理流程中承担的角色

分享数据知识,成就数据理想

点个在看 你最好看

搜索