幾何分布・負の2項分布と中心極限定理の例

Table of Contents

幾何分布と負の2項分布について例を紹介します。

例題

2つのサイコロを同時に振ります。この試行をAと呼ぶことにします。両方とも1が出る場合を T, そうでない場合を F と表現することにします。

試行AをTが出現するまで繰り返し、 Tが出た時点で終了とします。この試行をBと呼ぶことにします。

試行Bにおける、Fの回数、すなわちサイコロを振った回数から1引いたものを R と呼ぶことにします。サイコロを振ったけれども両方とも1にならなかった回数です。

試行Bを $c$ 回繰り返したときの、 R の平均を $X$ とします。

$X$ の確率

$c, X$ についての確率を $\textrm{P}(c, X)$ と書くことにします。

(c=1) の場合を考えます。基本的にサイコロを1回振るとき、 T の出る確率は $\frac{1}{36}$ 、 F の出る確率は $\frac{35}{36}$ です。 $\textrm{P}(1, X)$ は F が $X$ 回続いた後で、 T が出る確率ですから、

$\textrm{P}(1, X) = \left(\frac{35}{36}\right)^X \frac{1}{36}$

となります。これは $X(=cX)$ についての幾何分布です。

一般の $c$ について考えます。サイコロを全部でサイコロを振るのは $(cX+c)$ 回です。このような目の出方になるのは、 $c$ 回の T のいずれかの前に、 $cX$ 回のFを並べる重複組み合わせ ${}_X \textrm{H} _{cX} (= {}_{c+cX-1} \textrm{C} _{cX} = {}_{c+cX-1} \textrm{C} _{c-1})$ です。見方を変えると、最後のゾロ目を除いた $(c+cX-1)$ 回の中でどの $(c-1)$ 回を T にするかの組み合わせ ${}_{c+cX-1} \textrm{C} _{c-1}$ です。 $c \gt 1$ では $X$ は整数以外の値をとることに注意してください。

その確率は、

$\textrm{P}(c, X) = {}_{c+cX-1} \textrm{C} _{c-1} \left(\frac{35}{36}\right)^{cX} \left(\frac{1}{36} \right)^c$

となります。これは $cX$ についての負の二項分布です。 $X$ については複数回の試行 $B$ での平均の分布ですから、中心極限定理が成立します。

確率分布をグラフにする

$c=1,2,5,10,20,50,100$ の場合の折れ線グラフを表示してみましょう。 Excel や LibreOffice では、 COMBIN 関数で組み合わせを計算できますので、それを利用してグラフを描画します。

全部を一緒に重ねるとみづらくなってしまうので、 $c\textrm{P}(c,X)$ のグラフを $c=1,2,5,10,20,50,100$ について重ねて表示します。整数値の $X$ についてしかプロットしていませんので、 $c = 100$ のグラフは少し粗くなっています。

$c=1$ では左右非対称どころか右肩下がりの分布でしたが。 $c$ を増加させることで正規分布に似てきていますね。 $c$ を増加させると $X=35$ が一番確率の大きくなる値になるように、分布が変化していきます。

幾何分布

$c=1$ の時は幾何分布でした。幾何分布が $X = 1, 2, 3, \cdots$ について $\textrm{P}(X) = p (1-p)^{X-1}$ で表される時、 $E(X) = \frac{1}{p}$ , $V(X) = \frac{1-p}{p^2}$ です。

上の例では $p=\frac{1}{36}$ として $\textrm{P}(X) = (1-p) \cdot p (1-p)^X$ と書けるので、期待値は $E(X) = \frac{1-p}{p} = 35$ 、分散は $V(X) = 35 \cdot 36$ となります。

負の2項分布

$c = 1$ も含めて一般の $c$ では負の二項分布でした。負の二項分布は $k$ 回目の成功を得るまでの失敗回数 $X (= 0, 1, \cdots)$ についての確率が $\textrm{P}(X) = {}_{k+X-1} C_{X} p^k (1-p)^X$ で表される時、 $E(X) = k \frac{1-p}{p}$ , $V(X) = k \frac{q}{p^2}$ となります。

上の例では $p=\frac{1}{36}$ , $c$ 回目の成功を得るまでの失敗回数 $cX$ についての負の2項分布として $\textrm{P}(cX) = {}_{c+cX-1} \textrm{C}_{cX} p^c (1-p)^{cX}$ と書けるので、 $E(cX) = c 35$ , $V(cX) = c 35 \cdot 36$ となります。これより $E(X)=35$ , $V(X) = \frac{35 \cdot 36}{c}$ です。確かにグラフで見たのと同じように、期待値は 35 になります。

この記事を見た人は次の記事も見ています

中心極限定理と対数の法則のシミュレーション図解で理解する統計学

The Life

幾何分布・負の2項分布と中心極限定理の例