如何求概率分布的方差

方差

方差是概率分布的第二个最重要的度量，仅次于平均值。它量化了概率分布结果的分布。如果方差很低，那么结果很接近，而具有高方差的分布的结果可能彼此相距很远。

要理解方差，你需要有一些关于期望和概率分布的知识。如果你没有这些知识，我建议你阅读我的文章概率分布的均值．

概率分布的方差是距离分布均值的平方的平均值。如果你对概率分布进行多个样本，期望值，也称为平均值，是你平均得到的值。你取的样本越多，样本结果的平均值就越接近均值。如果取无穷多个样本，那么这些结果的平均值就是均值。这被称为大数定律。

低方差分布的一个例子是相同巧克力棒的权重。尽管包装上说所有的重量都是一样的——比如500克——但实际上，会有轻微的变化。有的可能是498或499克，有的可能是501或502克。平均值是500g，但有一些方差。在这种情况下，方差会非常小。

然而，如果你单独看每个结果，那么这个单一结果很可能不等于平均值。从单个结果到平均值的平方距离的平均值称为方差。

高方差分布的一个例子是超市顾客的消费金额。平均金额可能是25美元左右，但有些人可能只花1美元买一件产品，而另一些客户组织了一个大型派对，花了200美元。由于这些量都远离平均值，因此该分布的方差很高。

这就导致了一些听起来自相矛盾的事情。但如果你取一个方差很大的分布样本，你不会期望看到期望值。

随机变量X的方差多记为Var(X)。然后:

Var(X) = E[(X - E[X])²= e [x]²- e [x]²

这最后一步可以解释如下:

E[(x - E[x])²= e [x]²- 2xe [x] + e [x]²= e [x]²2 e [xe [x]] + e [e [x]]²

由于期望的期望等于期望，即E[E[X]] = E[X]，因此简化为上面的表达式。

如果你想计算概率分布的方差，你需要计算E[X]²- e [x]²．重要的是要明白这两个量是不一样的。一个随机变量的函数的期望不等于这个随机变量的期望的函数。计算X的期望^2，我们需要无意识统计学家的法则。这个奇怪的名字的原因是，人们倾向于把它当作一个定义来使用，而实际上，它是一个复杂证明的结果。

该定律指出，随机变量X的函数g(X)的期望等于:

Σg(x)*P(x =x)为离散随机变量。

∫G (x)f(x) dx是连续随机变量。

这有助于我们找到E[X]²]，因为这是g(X)的期望，其中g(X) = X²．X²也叫做X的二阶矩，一般来说，Xⁿ是X的n阶矩。

作为一个例子，我们将看看成功概率为p的伯努利分布。在这个分布中，只有两种结果是可能的，即成功时为1，不成功时为0。因此:

E[X] = Σx P(X= X) = 1* P + 0*(1- P) = P

E (X)²] = Σx²P(X= X) = 1²*p + 0²*(1-p) = p

方差是p - p²．所以当我们看一个硬币，如果是正面，我们赢1美元，如果是反面，我们赢0美元，我们有p = 1/2。因此均值是1/2，方差是1/4。

另一个例子是泊松分布。这里我们知道E[X] = λ。为了找到E[X²我们必须计算:

E (X)²] = Σx²P(X= X) = Σx²*λ^x* e^{- - - - - -λ}/ x !e =λ^{- - - - - -λ}Σx *λ^{x - 1}/ (x - 1) !e =λ^{- - - - - -λ}(λe^λ+ e^λ) = λ²+λ

如何精确地求解这个和是相当复杂的，超出了本文的范围。一般来说，计算更高时刻的期望可能涉及一些复杂的问题。

这允许我们计算方差，因为它是λ²+λ - λ²=λ。对于泊松分布，均值和方差相等。

连续分布的一个例子是指数分布。它的期望是1/λ。第二个矩的期望是:

E (X)²]∫²λe^-λxdx。

同样，解这个积分需要涉及部分积分的高级计算。如果你这样做，你会得到2/λ²．因此，方差为:

2 /λ²- 1 /λ²= 1 /λ²．

因为根据定义，方差是平方，所以它是非负的，所以我们有:

对于所有X, Var(X)≥0。

如果Var(X) = 0，那么对于某个a, X等于某个值的概率一定等于1。或者换一种说法，如果没有方差，那么只能有一种可能的结果。反之亦然，当只有一种可能结果时，方差等于零。

关于加法和标量乘法的其他属性给出:

Var(aX) = a²Var(X)对于任意标量a。

Var(X + a) = Var(X)对于任意标量a。

Var(X+Y) = Var(X) + Var(Y) + Cov(X,Y)。

这里Cov(X,Y)是X和Y的协方差，这是X和Y之间依赖关系的度量，如果X和Y是独立的，那么协方差为零，那么和的方差等于方差的和。但当X和Y是相关的，协方差必须考虑在内。

据作者所知，这些内容是准确和真实的，并不意味着要取代来自合格专业人士的正式和个性化的建议。