在概率论与统计学中,超几何分布是一种离散型概率分布,它描述了从有限数量的物品中抽取样本时,不放回抽样条件下特定事件发生的概率。这种分布广泛应用于质量控制、生物学、生态学以及社会科学等领域。
假设我们有一个总数为 \( N \) 的物品集合,其中包含 \( K \) 个具有某种特性的物品(比如合格品或某种物种)。现在随机从中抽取 \( n \) 个物品作为样本,并且我们关心的是在这 \( n \) 个样本中有 \( k \) 个具有该特性的概率是多少。
超几何分布的概率质量函数可以表示为:
\[
P(X = k) = \frac{\binom{K}{k} \cdot \binom{N-K}{n-k}}{\binom{N}{n}}
\]
其中:
- \( \binom{a}{b} \) 表示组合数,即从 \( a \) 个不同元素中选取 \( b \) 个元素的方法数目。
- \( X \) 是随机变量,代表样本中具有指定特性物品的数量。
- \( P(X = k) \) 是当 \( X \) 等于 \( k \) 时的概率。
这个公式表明,在不放回的情况下,每个可能的结果都有其相应的概率。例如,在生产线上检查产品是否合格时,如果总共有 100 件产品中有 20 件是次品,那么从这批产品中随机取出 5 件,恰好有 3 件是次品的概率就可以通过上述公式计算得出。
值得注意的是,由于每次抽取后样本空间会发生变化(即不再放回),因此每次试验之间不是独立事件。这也使得超几何分布在处理实际问题时更加贴近现实情况。
总之,超几何分布为我们提供了一个有效的工具来分析和预测那些涉及有限总体且不重复抽样的场景中的概率现象。无论是企业质检还是环境监测,都可以利用这一理论来进行科学决策和支持。