幾何分布・負の2項分布と中心極限定理の例


幾何分布と負の2項分布について例を紹介します。

例題

2つのサイコロを同時に振ります。 この試行をAと呼ぶことにします。 両方とも1が出る場合を T, そうでない場合を F と表現することにします。

試行AをTが出現するまで繰り返し、 Tが出た時点で終了とします。 この試行をBと呼ぶことにします。

試行Bにおける、Fの回数、すなわち サイコロを振った回数から1引いたものを R と呼ぶことにします。 サイコロを振ったけれども両方とも1にならなかった回数です。

試行Bを \(c\) 回 繰り返したときの、 R の平均を \(X\) とします。

\(X\) の確率

\(c, X\) についての確率を \(\textrm{P}(c, X)\) と書くことにします。

\(c=1\) の場合を考えます。 基本的に サイコロを1回振るとき、 T の出る確率は \(\frac{1}{36}\) 、 F の出る確率は \(\frac{35}{36}\) です。 \(\textrm{P}(1, X)\) は F が \(X\) 回続いた後で、 T が出る確率ですから、

\[ \textrm{P}(1, X) = \left(\frac{35}{36}\right)^X \frac{1}{36} \]

となります。 これは\(X(=cX)\)についての幾何分布です。

一般の \(c\) について考えます。 サイコロを 全部でサイコロを振るのは \( (cX+c) \) 回 です。 このような目の出方になるのは、 \(c\)回の T のいずれかの前に、 \(cX\)回のFを並べる重複組み合わせ \({}_X \textrm{H} _{cX} (= {}_{c+cX-1} \textrm{C} _cX = {}_{c+cX-1} \textrm{C} _{c-1})\)です。 見方を変えると、 最後のゾロ目を除いた \( (c+cX-1) \)回の中でどの\( (c-1) \)回を T にするかの組み合わせ \({}_{c+cX-1} \textrm{C} _{c-1} \) です。 \(c \gt 1\) では \(X\) は整数以外の値をとることに注意してください。

その確率は、

\[ \textrm{P}(c, X) = {}_{c+cX-1} \textrm{C} _{c-1} \left(\frac{35}{36}\right)^{cX} \left(\frac{1}{36} \right)^c \]

となります。 これは \(cX\) についての 負の二項分布です。 \(X\) については複数回の試行\(B\)での平均の分布ですから、中心極限定理が成立します。

確率分布をグラフにする

\(c=1,2,5,10,20,50,100\) の場合の折れ線グラフを表示してみましょう。 Excel や LibreOffice では、 COMBIN 関数 で組み合わせを計算できますので、 それを利用してグラフを描画します。

\(c=1\)
\(c=2\)
\(c=5\)
\(c=10\)
\(c=20\)
\(c=50\)
\(c=100\)

全部を一緒に重ねるとみづらくなってしまうので、 \(c\textrm{P}(c,X)\) のグラフを \(c=1,2,5,10,20,50,100\) について重ねて表示します。 整数値の \(X\) についてしかプロットしていませんので、 \(c = 100\) のグラフは少し粗くなっています。

\(c=1\) では左右非対称どころか右肩下がりの分布でしたが。 \(c\) を増加させることで正規分布に似てきていますね。 \(c\) を増加させると \(X=35\) が一番確率の大きくなる値になるように、分布が変化していきます。

幾何分布

\(c=1\) の時は幾何分布でした。 幾何分布が \(X = 1, 2, 3, \cdots\) について \(\textrm{P}(X) = p (1-p)^{X-1}\) で表される時、 \(E(X) = \frac{1}{p}\), \(V(X) = \frac{1-p}{p^2}\) です。

上の例では \(p=\frac{1}{36}\) として \(\textrm{P}(X) = (1-p) \cdot p (1-p)^X\) と書けるので、 期待値は \(E(X) = \frac{1-p}{p} = 35\) 、 分散は \(V(X) = 35 \cdot 36 \) となります。

負の2項分布

\(c = 1\) も含めて 一般の \(c\) では負の二項分布でした。 負の二項分布は \(k\) 回目 の成功を得るまでの失敗回数 \(X (= 0, 1, \cdots)\) についての確率が \(\textrm{P}(X) = {}_{k+X-1} C_{X} p^k (1-p)^X\) で表される時、 \(E(X) = k \frac{1-p}{p}\), \(V(X) = k \frac{q}{p^2}\) となります。

上の例では \(p=\frac{1}{36}\), \(c\) 回目 の成功を得るまでの失敗回数 \(cX\) についての負の2項分布として \(\textrm{P}(cX) = {}_{c+cX-1} \textrm{C}_{cX} p^c (1-p)^{cX} \) と書けるので、 \(E(cX) = c 35\), \(V(cX) = c 35 \cdot 36\) となります。 これより \(E(X)=35\), \(V(X) = \frac{35 \cdot 36}{c}\) です。 確かにグラフで見たのと同じように、期待値は 35 になります。