新闻中心

深入浅出数据分析(3)(7~9)(深入浅出数据分析和深入浅出统计学的区别)

2023-04-27
浏览次数:
返回列表

第一部分、主观概率

主观概率:是将__不同观点__进行量化的手段,主要是为了反映群体在某件事情上的分歧情况。当人们就某件事是否会发生发表自己的观点时,如果大家都七嘴八舌的说,到时候就会显得很混乱,而如果换种方法,比方说你认为这个事情发生的概率有多大?然后将大家的意见进行统计起来,就可以看出大家的意见是否都一致(使用标准差计算主观概率变动范围)。举例: 分析师们在XXX是否会补贴石油行业上发表意见,如果大家意见比较一致,公司有可能就有可能会投资XXX石油业。

使用贝叶斯规则将_新的变化_融入判断:比如在上面的例子中,由于大家意见比较统一,公司投了许多钱在俄罗斯石油上,假设现在一家俄罗斯小报发了关于XXX政府将卖掉油田的负面新闻,后面该如何决策?

毫无疑问,决策依据还是有看分析师们在XXX小报发表负面新闻后对XXX石油行业的看法。也就是:XXX在卖出油田后继续支持石油行业的可能性有多大(或者说当负面新闻成真的情况下,XXX继续补贴的概率有多大)。在这种情况下,根据贝叶斯规则,如果设XXX卖出油田为事件E,继续补贴石油业为事件S,那么原问题就成了求解P(S|E)(条件概率,见上一篇),根据P(S|E)=P(S)*P(E|S)/(P(S)*P(E|S)+P(~S)*P(E|~S))

则还需要知道两组主观概率,也就是在XXX支持石油行业和不支持石油行业的情况下卖掉油田的概率。然后再将分析师的主观概率用散点图画出来,看意见的分歧程度。

注1:关于这里我其实是很瞢逼的,将一个人的主观概率用数字量化还好。因为可以用数字表现一个人信念的强度,但后面用贝叶斯规则推算新的概率就感觉很多此一举了,为什么要让分析师去推测在支持与不支持石油行业的情况下俄罗斯卖出的概率,然后在此基础之上去预测俄罗斯继续补贴的概率呢,反正都是主观,为什么不直接预测在俄罗斯卖出油田下继续支持石油业的可能性,而要绕这么一个大圈呢?

好吧,看了这个图之后,我还是不明白~~~

注2:关于主观概率由于评判一群人对某些事件的看法或者信念,我能想到的应用就是各种调查表,提供ABCD选项给被调查者表达意见,最后汇总以了解对某些事件(或者对公司产品的功能)的看法。

第二部分:启发法

启发法是指在无法客观评估一件事情的绩效的时候,用一些其他的方法进行评价。邋遢集项目里面(采用教育的方式试图减少垃圾产生量),市政厅需要对是否继续支持邋遢集项目进行表决。而要评估邋遢集项目绩效,最直接的方法计量项目实施前垃圾产生量和项目实施后的垃圾产生量。但是计量工作本身所需花费的数字是个天文数字。由于无法直接对邋遢集项目绩效进行评估,所以每个议员都有自己的小九九(也就是前面章节说到的心智模型)。而通过各种其他方法对邋遢集项目进行评估的方法就是启发法。。。启发法这个东西,其实就是对心智模型的应用,比如评估一个项目,你要用a指标,但别人要用b指标,最终还是要看谁更有道理,谁的巴掌比较硬,谁能说服谁,这实际上就要求我们要非常熟悉业务。再比如,评估一个项目好坏,可能最直接的方式是看收益率,但是有可能这个项目很长一段时间都不能赚钱,这时,我们可能就要看最终由谁拍板,然后选择他所偏爱的指标。比如面相环保局,你就得证明环保事业杠杠的,面对政府,你就得证明提供的就业杠杠的,交的税多多的。。。额,好像偏题了。总之,启发法,就是在直接评估绩效有困难的情况下,采用一些更为容易的套路(也就是心智模型)进行评估: 因此启发法的实际效果其实是因人而异的,「老司机」显然经验更加丰富,效果也会更好一些。

第三部分:直方图

直方图我觉得只要了解几个简单的特性就可以了:1)直方图反映的是一维数据集分布情况,每一个直方代表的是数据集在某个范围的频数; 2)数据集中的范围代表了数据的特征,比如说我们统计某一行业毛利率是,假设其在0.2~0.25范围内最为密集,代表该行业毛利率水平可能在0.2~0.25之间; 3) 如果数据没有体现出一定的特征,可能需要对数据进行降维,比如: 假设我们看公用事业毛利率,发现其并没有收敛在一个较小的数据范围,我们可能要进一步进行分解子行业(我叫它降维,而书里面叫做数据子集),比如:水务、燃气、垃圾处理等等。注意直方图是表达「一维数据集」分布情况,也就是回答诸如X%的数据落在[x,y]区间这样的问题就可以了。(比如5%的用户在平台消费100元以上,80%的用户三个月内消费在两次以下,诸如此类)

PS1. 这本书虽然看起来比较简单,但是写起来枯燥无比。这个书其实早就看完了,但是有些时候要想聊聊自己的理解,又要停下来想想,也要回过头来重新看看,下个周,把10~14章啃了,这本书也就算看过了。

PS2. 书里面有提到R的用法,不过我本人不用R,所以就不写了。周末愉快

搜索