Fisher精确检验和超几何分布
Fisher精确检验
我想和我的朋友们分享一些M豆,所以我只拿了一把,包括7个蓝豆和1和红豆。如何说明M豆颜色的分布?我有更多的蓝豆?我能从这个M豆样本中计算出一个p值吗?

我买了一袋M豆,一共有40颗,其中比例见下图:

我要用"理想" m&m包的直方图,根据我从网上查到的比例,还有我的"样本",我的一小把m&m豆来确定我的样本是否特别?我不关心m&m豆落到我手里的顺序,所以我们考虑7个蓝豆和1个红豆所有可能顺序。

让我们先计算得到7个蓝色m&m和1个红色m&m的概率。第一个m&m是蓝色的概率是8/40,由于现在我手里有一个蓝豆,所以还剩下7颗蓝豆。第二个m&m是蓝色的概率是7/39,此时剩下6颗蓝豆。第三个m&m是蓝色的概率是6/38......第七个m&m是蓝色的概率是1/34。第八个m&m是红色的概率是5/33。把这些概率相乘得到7个蓝豆和1个红豆的概率,=0.000000065。这很少见,但是记住,我们不关心顺序。要得到7个蓝1个红的概率,我们必须把每种可能的顺序的概率加起来。由于每种顺序的概率相同,我们只需*7=0.00000053。

p值是所有同样罕见或更罕见事件的概率之和,例如8个蓝豆,还有7个橘黄豆和1个蓝豆 etc.etc.etc.。再一次,用电脑计算,p值是0.01,所以我的样本很特别!
我们刚刚对m&m进行了Fisher精确检验!!!!对其他东西的富集,比如“这个基因列表比正常的更参与新陈代谢吗?”也是以同样的方式进行的。

网友评论