跳到主要内容

如何求概率分布的方差

  • 作者:
  • 更新日期:
你知道如何求概率分布的方差吗?

你知道如何求概率分布的方差吗?

方差

方差是概率分布的第二个最重要的度量,仅次于平均值。它量化了概率分布结果的分布。如果方差很低,那么结果很接近,而具有高方差的分布的结果可能彼此相距很远。

要理解方差,你需要有一些关于期望和概率分布的知识。如果你没有这些知识,我建议你阅读我的文章概率分布的均值

二次曲线

二次曲线

什么是概率分布的方差?

概率分布的方差是距离分布均值的平方的平均值。如果你对概率分布进行多个样本,期望值,也称为平均值,是你平均得到的值。你取的样本越多,样本结果的平均值就越接近均值。如果取无穷多个样本,那么这些结果的平均值就是均值。这被称为大数定律。

低方差分布的一个例子是相同巧克力棒的权重。尽管包装上说所有的重量都是一样的——比如500克——但实际上,会有轻微的变化。有的可能是498或499克,有的可能是501或502克。平均值是500g,但有一些方差。在这种情况下,方差会非常小。

然而,如果你单独看每个结果,那么这个单一结果很可能不等于平均值。从单个结果到平均值的平方距离的平均值称为方差。

高方差分布的一个例子是超市顾客的消费金额。平均金额可能是25美元左右,但有些人可能只花1美元买一件产品,而另一些客户组织了一个大型派对,花了200美元。由于这些量都远离平均值,因此该分布的方差很高。

这就导致了一些听起来自相矛盾的事情。但如果你取一个方差很大的分布样本,你不会期望看到期望值。

方差的形式定义

随机变量X的方差多记为Var(X)。然后:

Var(X) = E[(X - E[X])2= e [x]2- e [x]2

这最后一步可以解释如下:

E[(x - E[x])2= e [x]2- 2xe [x] + e [x]2= e [x]22 e [xe [x]] + e [e [x]]2

由于期望的期望等于期望,即E[E[X]] = E[X],因此简化为上面的表达式。

你知道怎么计算方差吗?

你知道怎么计算方差吗?

计算方差

如果你想计算概率分布的方差,你需要计算E[X]2- e [x]2.重要的是要明白这两个量是不一样的。一个随机变量的函数的期望不等于这个随机变量的期望的函数。计算X的期望2,我们需要无意识统计学家的法则。这个奇怪的名字的原因是,人们倾向于把它当作一个定义来使用,而实际上,它是一个复杂证明的结果。

该定律指出,随机变量X的函数g(X)的期望等于:

Σg(x)*P(x =x)为离散随机变量。

G (x)f(x) dx是连续随机变量。

这有助于我们找到E[X]2],因为这是g(X)的期望,其中g(X) = X2.X2也叫做X的二阶矩,一般来说,Xn是X的n阶矩。

方差计算的几个例子

作为一个例子,我们将看看成功概率为p的伯努利分布。在这个分布中,只有两种结果是可能的,即成功时为1,不成功时为0。因此:

E[X] = Σx P(X= X) = 1* P + 0*(1- P) = P

E (X)2] = Σx2P(X= X) = 12*p + 02*(1-p) = p

方差是p - p2.所以当我们看一个硬币,如果是正面,我们赢1美元,如果是反面,我们赢0美元,我们有p = 1/2。因此均值是1/2,方差是1/4。

另一个例子是泊松分布。这里我们知道E[X] = λ。为了找到E[X2我们必须计算:

E (X)2] = Σx2P(X= X) = Σx2x* e- - - - - -λ/ x !e =λ- - - - - -λΣx *λx - 1/ (x - 1) !e =λ- - - - - -λ(λeλ+ eλ) = λ2

如何精确地求解这个和是相当复杂的,超出了本文的范围。一般来说,计算更高时刻的期望可能涉及一些复杂的问题。

这允许我们计算方差,因为它是λ2+λ - λ2=λ。对于泊松分布,均值和方差相等。

连续分布的一个例子是指数分布。它的期望是1/λ。第二个矩的期望是:

E (X)2]∫2λe-λxdx。

同样,解这个积分需要涉及部分积分的高级计算。如果你这样做,你会得到2/λ2.因此,方差为:

2 /λ2- 1 /λ2= 1 /λ2

方差的性质

因为根据定义,方差是平方,所以它是非负的,所以我们有:

对于所有X, Var(X)≥0。

如果Var(X) = 0,那么对于某个a, X等于某个值的概率一定等于1。或者换一种说法,如果没有方差,那么只能有一种可能的结果。反之亦然,当只有一种可能结果时,方差等于零。

关于加法和标量乘法的其他属性给出:

Var(aX) = a2Var(X)对于任意标量a。

Var(X + a) = Var(X)对于任意标量a。

Var(X+Y) = Var(X) + Var(Y) + Cov(X,Y)。

这里Cov(X,Y)是X和Y的协方差,这是X和Y之间依赖关系的度量,如果X和Y是独立的,那么协方差为零,那么和的方差等于方差的和。但当X和Y是相关的,协方差必须考虑在内。

据作者所知,这些内容是准确和真实的,并不意味着要取代来自合格专业人士的正式和个性化的建议。

Baidu