新闻中心

一文弄懂贝叶斯统计(贝垏詺作品)

2023-04-27
浏览次数:
返回列表

最近,我正在读《深入浅出数据分析》这本书。

上期跟大家分享的书中主题是「如何进行假设检验?」。

今天,我来聊聊「贝叶斯统计」,换个方式理解概率:不用「1%」,而是用「100个人中有1个」来思考。

01

1、要是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。

2、条件概率即以一件事的发生为前提的另一件事的发生概率。比如:以阳性试验结果为条件的蜥蜴流感概率。注意:这里「阳性」结果已发生,作为前提条件,探讨你患蜥蜴流感的概率。

3、要弄清楚你在「阳性」情况下患蜥蜴流感的概率,其根本在于了解这些数字代表的实际人数。

4、但首先要知道有多少人患了蜥蜴流感,然后可以用这些百分比来计算符合每个组的实际人数。

5、研究表明总人口中有1%的人患有蜥蜴流感。1%是基础概率,在根据试验结果单独分析每个人的情况之前,你就已经知道患有蜥蜴流感的人口只有1%,因此基础概率又称作事前概率。

02

6、计算一下你患蜥蜴流感的概率,假定以1000人为基础进行计算,将人数填写在以下空白中,按照基础概率和试验指标分组。

条件:

总人口中1%的人患了蜥蜴流感。若某人已患蜥蜴流感:试验结果为阳性的概率为90%。若某人未患蜥蜴流感:试验结果为阳性的概率为9%。

结论:在试验结果为阳性的情况下,你患蜥蜴流感的几率为9%!远低于基础概率90%。

7、用简单的整数思考复杂的概率。当你想像着自己在观察1000个人时,就已经从思考小数概率转换为思考整数。我们的大脑生来不擅长处理概率数字,因此,将概率转变为整数,然后进行思考,是避免犯错误的一个有效办法。

8、搜集到新数据后,用贝叶斯规则处理基础概率。你刚刚用了一次人们常用的贝叶斯规则,这是一个强悍无比的统计公式,有了这个公式,你就能用基础概率和条件概率估计新的条件概率。

9、贝叶斯规则可以反复使用。贝叶斯规则是一个重要的数据分析工具,它提供了一种把新信息整合到分析中的精确方法。

03

10、现在做第二次试验(比第一次更先进,收费更贵),结果为阴性,你放心了吗?最好再分析一遍数据。现在你知道了,不考虑基础概率就紧张试验结果(甚至紧张试验正确性统计),不过是在添乱罢了。

11、用基础概率和新的试验统计值可以算出你患蜥蜴流感的新概率。

12、基础概率不会是1%,新基础概率是9%,我们刚算过,这正是我自己的患病概率。

13、新信息会改变你的基础概率。拿到第一项试验结果时,你把大家的蜥蜴流感发病率当做自己的基础概率。

14、但你从试验结果中了解到,你患蜥蜴流感的概率高于基础概率;这个高概率是你的新基础概率,因为现在你属于试验结果为阳性的人群。

04

15、让我们赶快再用贝叶斯规则算一算……

条件:

你患蜥蜴流感的基础概率为9%。若某人已患蜥蜴流感:试验结果为阳性的概率为99%。若某人未患蜥蜴流感:试验结果为阳性的概率为1%。

结论:你患蜥蜴流感的机会是0.1%!

16、放心多了!你用贝叶斯规则控制概率,并且现在知道如何管理基础概率了。避免基本概率谬误的唯一办法就是对基础概率提高警惕,而且务必要将基础概率整合到分析中。现在不用怕感冒了……

END

其他比较受欢迎的内容,希望对你有帮助:

如何给老板发工资?这样做节税15.6万

一次通关!全网最全CPA综合备考攻略

小强升职记:时间管理故事书

《十年涨薪30倍:财务职场透视》读书笔记

数据分析与心智模型

数据如何实现图形化?

看完点个赞,以后分享更多

搜索