二項分布とその平均・分散


2項分布についてまとめました。

定義

正整数 \( n \) 、 確率変数 \( X \in \mathbb{N} \ (0 \leq X \leq n)\) 、 1回あたりの施行における確率を \( p \) として、次の式が成り立つ分布を2項分布といいます。

\[ \textrm{P}(X = x) = \begin{pmatrix}n \\ x\end{pmatrix} p^x (1-p)^{n-x} \]

成功・失敗という2つの事象についての分布で、 確率変数 \(X\) は、 \( n \) 回施行を繰り返した時の成功の回数を表します。 1回の施行について成功になる確率が \( p \) (固定) である場合に使えます。

確率変数 \(X\) が2項分布に従う場合、 \(n\), \(p\) を用いて次のように記述します。

\[ X \sim \textrm{Binomial}(n, p) \]

具体例

\(n\) 回 サイコロを投げる場合の1の目が出る数 \(x\) (\(p=\frac{1}{6}\))。

\(n\) 個の サイコロを一度に投げる場合の1の目が出る数 \(x\) (\(p=\frac{1}{6}\))。

\(n\)回コインを投げる場合の表の出る回数 \(x\) (\(p=\frac{1}{2}\))。

\(n\)個のコインを一度に投げる場合の表の出る枚数 \(x\) (\(p=\frac{1}{2}\))。

平均(期待値)の計算

平均(期待値)は次のように計算されます。

\begin{eqnarray*} \textrm{E}(X) & = & \sum _{x=0}^{n} x \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} \\ & = & \sum _{x=1}^{n} x \begin{pmatrix} n \\ x\end{pmatrix} p^x (1-p) ^{n-x} \\ & = & \sum _{x=1}^{n} x \frac{n!}{x!(n-x)!} p^x (1-p) ^{n-x} \\ & = & \sum _{x=1}^{n} n \frac{(n-1)!}{(x-1)!(n-x)!} p^x (1-p) ^{n-x} \\ & = & \sum _{x=1}^{n} n \begin{pmatrix} n – 1 \\ x – 1 \end{pmatrix} p^x (1-p) ^{n-x} \\ & = & \sum _{x=0}^{n-1} n \begin{pmatrix} n – 1 \\ x \end{pmatrix} p^{x+1} (1-p) ^{n-1-x} \\ & = & \sum _{x=0}^{n-1} np \begin{pmatrix} n – 1 \\ x \end{pmatrix} p^x (1-p) ^{n-1-x} \\ & = & np \sum _{x=0}^{n-1} \begin{pmatrix} n – 1 \\ x \end{pmatrix} p^x (1-p) ^{n-1-x} \\ & = & n p (p + 1 – p)^{n – 1} \\ & = & n p \cdot 1 \\ &=& np \\ \end{eqnarray*}

分散は次のように計算されます。

\begin{eqnarray*} \textrm{V}(X) & = & \sum _{x=0}^{n} \left(x – np\right)^2 \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} \\ & = & \sum _{x=0}^{n} \left(x^2 -2 x np + n^2 p^2\right) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} \\ & = & \sum _{x=0}^{n} \left(x^2 -2 x np \right) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} + n^2 p^2\\ & = & \sum _{x=0}^{n} \left(x^2 -x + x – 2 x np \right) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} + n^2 p^2 \\ & = & \sum _{x=0}^{n} x(x -1) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} \\ & & \quad + (1 – 2 np) \sum _{x=0}^n x \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x} + n^2 p^2 \\ & = & \sum _{x=0}^{n} x(x -1) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x}+ (1 – 2 np) np + n^2 p^2 \\ & = & \sum _{x=0}^{n} x(x -1) \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p) ^{n-x}+ (1 – np) np \\ & = & \sum _{x=0}^{n} x(x -1) \frac{n!}{x!(n-x)!} p^x (1-p) ^{n-x}+ (1 – np) np \\ & = & \sum _{x=2}^{n} x(x -1) \frac{n!}{x!(n-x)!} p^x (1-p) ^{n-x}+ (1 – np) np \\ & = & \sum _{x=2}^{n} x(x -1) \frac{n!}{x!(n-x)!} p^x (1-p) ^{n-x}+ (1 – np) np \\ & = & \sum _{x=2}^{n} n(n -1) \frac{(n-2)!}{(x-2)!(n-x)!} p^x (1-p) ^{n-x}+ (1 – np) np \\ & = & \sum _{x=0}^{n-2} n(n -1) \frac{(n-2)!}{x!(n-2-x)!} p^{x+2} (1-p) ^{n-x-2}+ (1 – np) np \\ & = & p^2 n(n-1) \sum _{x=0}^{n-2} \frac{(n-2)!}{x!(n-2-x)!} p^{x} (1-p) ^{n-x-2}+ (1 – np) np \\ & = & p^2 n(n-1) + (1 – np) np \\ & = & p^2 n^2 – p^2n + np – n^2 p^2 \\ & = & – p^2n + np \\ & = & np(1-p) \end{eqnarray*}

R での計算

R で2項分布を計算するには dbinom, pbnom を使います。

dbinom

dbnom(x, n, p) は \(X \sim \textrm{Binomial}(n, p) \) なる \(X \) について \(P(X=x)\) を計算します。

pbinom

pbnom(x, n, p) は \(X \sim \textrm{Binomial}(n, p) \) なる \(X\) について \(P(X \leq x)\) を計算します。