Table of Contents
Binomial Distribution (textrm{Binomial}(m, p)) is similar to Normal and Poisson distributions.
Especially (n) is large, it can be approximated as a normal distribution, according to the central limit theorem.
Let’s see the similarity with graphics.
Basic of the Graohs
I created the graphs with Google Spreadsheet. In Google Spreadsheet, we can calculate the probability in binomial distribution by BINOMDIST
, normal distribution by NORMDIST
, Poisson distribution by POISSON.DIST
.
(n=100)
Let’s compare binomial distribution in case of ( n = 100 ). The normaldistribution to be compared is (textrm{Normal}(np, sqrt{np(1-p)})). The poisson distribution to be compared is (textrm{Poisson}(np)).
(p) の値をいろいろと変えてグラフを表示しています。 右の山から順に (p = 0.5), (p = 0.3), (p = 0.1) です。 さらにその左に表示されているのは ( p = 0.001, 0.0001 ) のグラフです。
When ( p = 0.5, 0.3, 0.1 ), the binomial distribution is near to the normal distribution.
(p=0.001, 0.0001) の グラフを表示するエリアを変えて確認してみます。
正規分布よりもポアソン分布のほうが2項分布に近くなっているのがわかるでしょうか。 基本的に (p) がとても小さい場合、 正規分布では全ての確率を足した時に1になるようにするために、 (x = np) のときの確率が1より高くする必要が出てきます。 1より高いと確率の関数として成り立ちませんから、 (p) があまりにも小さい場合は正規分布は2項分布からずれてきます。
(n=1000)
(n = 1000) の場合のグラフは次のようになります。
これも右から (p = 0.5), (p = 0.3), (p = 0.1) のグラフとなっています。 2項分布と正規分布はまさに瓜二つですね。 ポアソン分布は確実にずれていることがわかります。
(p= 0.001, 0.0001) のグラフを表示します。
正規分布もポアソン分布もどちらも似ていますが、 どちらかというとポアソン分布のほうが2項分布に近いですね。
(n=10000)
(p=0.01) 以上 の場合は2項分布と正規分布がそっくりになることがわかりました。 (n=10000, p = 0.001 ) の場合のグラフを比較してみます。
ここまでくると正規分布でもわずかな差になっていますが、やはりポアソン分布のほうが2項分布に似ていますね。 似ているというよりそっくりです。
(p=0.0001) の場合も見てみます。
こちらも正規分布が似てきていますが、ポアソン分布のほうが2項分布に近いですね。
(n=100000)
(p=0.0001) でも (n=100000) だったら正規分布も2項分布にそっくりになるかもしれません。 比較してみましょう。
実際には正規分布を使ってもいいのかもしれませんが、ポアソン分布のほうが2項分布に近いです。 (n) を大きくして比較してきましたが、(p)が小さければポアソン分布のほうが2項分布に近いんですね。
(n=50)
(p geq 0.01) では 2項分布に近いように見えた正規分布ですが、 (n) を小さくしても2項分布に近い値を出すのでしょうか。 (n=50) で比較してみます。
(n=100) の時に比べれば 2項分布と正規分布の差は開いていますが、 まだまだだいぶ似ている感じがします。
(n=20)
(n=20) の場合にも見てみましょう。
(p=0.1) のグラフはズレが大きいですね。 (p geq 0.03) ではまだ近似として正規分布が使えそうです。
(n=10)
(n=10) の場合も見てみましょう。
(p=0.03) のところもズレが大きくなり始めましたが、 (n=10) でも (p) の値によっては近似として使えそうな印象です。
以上、正規分布、ポアソン分布、2項分布の差を視覚的に表示しました。 特に、 (p) が小さい場合は正規分布よりもポアソン分布のほうが2項分布に近くなることが視覚的にわかりましたね。