海盗又提理科生了,那么俺就用纯理科思维谈谈海盗依赖的数据问题。
海盗作为理工科生肯定学过概率论吧,概率论中有一个“小概率事件原理”:
设H0 为一原假设,H1 为一与其对立的备择假设(也称对立假设),构造一个随机事件A,当原假设H0成立时,随机事件A以很小的概率发生,该事件称为小概率事件。一般来说,在一次试验中,小概率事件不应发生,若发生了,否定原假设H0 ,接受与其对立的备择假设H1。
这个原理读起来比较绕口,我们可以通俗讲一下。那首东北老歌:“棒打狍子瓢舀鱼,野鸡飞进铁锅里。”就是用艺术夸张的手法通俗演绎了小概率事件原理,以“瓢舀鱼”举例:
H0:河里的鱼很少。(原假设)
H1:河里的鱼很多。(对立假设)
A:用瓢从河里舀一瓢水,能舀到鱼。(随机事件)
当H0成立的时候,也就是河里的鱼很少,随机事件A为一个小概率事件,可以视为在一次试验中不会发生。这很容易理解,用瓢能舀到鱼几乎不可能。如果像歌中所唱的用瓢能舀到鱼,也就是A发生了,那么就否定H0,接受H1。也就是结论为:河里的鱼很多。所以这首歌要表达的意思是当年北大荒的野生动物资源非常丰富。
我们国家的监督检验的抽样检测方法就是依据小概率事件原理设计的。也就是说在小样本情况下抽测到不合格产品,就可以认定产品质量有问题。
言归正传,海盗当年在一位教授的指导下制作了一个表格,成为辩论利器,满屏粘贴,所向披靡,俺称之为大宝剑。当年海盗的第一把大宝剑的第一行数据是我们国家的盗窃率为500/10万人,而且数据来自国家统计年鉴,纯官方数据。俺简单算了一下,也就是说,每200个人才有一起盗窃事件。
俺对数据提出了质疑,说在坛子里统计一下吧,坛子里的人大约200人吧,有过被盗窃的有多少人。海盗说坛子里没那么多人,因为当时很萧条,只有大约20人。这下海盗掉坑里了,不用再统计了,俺就有被盗窃的经历,1/20的数据出现了,海盗提供的数据就已经崩塌了。
20人的样本是个小样本,这个样本中出现盗窃事件可以看做随机事件A,海盗可以按照小概率事件原理自己演绎一下,看看结论是什么。
海盗第一把大宝剑的第一个数据就站不住脚,昨天海盗自己都顺手修改了。所以俺一直调侃海盗的大宝剑,经常谐音称为大保健,海盗用对仗的小足疗反击,这也是典故的由来。
问题关键是我们数据的可信度,统计年鉴的数据可能不是编造的,是统计出来的,但是是真实现实的数据吗?大家可能都有类似经历,比如丢了自行车,钱包被偷了,你去派出所报案,能立案吗?能进入统计数据吗?
海盗完全依赖所谓数据,但是偏颇的数据自然就会带偏海盗的思维和结论。所以俺劝海盗不要做一个买履的郑人,鞋子合不合脚要用自己的脚去试,不要“宁信度,无自信也。”
|