Similarity among Binomial, Poisson and Normal Distributions


Binomial Distribution (textrm{Binomial}(m, p)) is similar to Normal and Poisson distributions.

Especially (n) is large, it can be approximated as a normal distribution, according to the central limit theorem.

Let’s see the similarity with graphics.

Basic of the Graohs

I created the graphs with Google Spreadsheet. In Google Spreadsheet, we can calculate the probability in binomial distribution by BINOMDIST, normal distribution by NORMDIST, Poisson distribution by POISSON.DIST.

(n=100)

Let’s compare binomial distribution in case of ( n = 100 ). The normaldistribution to be compared is (textrm{Normal}(np, sqrt{np(1-p)})). The poisson distribution to be compared is (textrm{Poisson}(np)).

(p) の値をいろいろと変えてグラフを表示しています。 右の山から順に (p = 0.5), (p = 0.3), (p = 0.1) です。 さらにその左に表示されているのは ( p = 0.001, 0.0001 ) のグラフです。

When ( p = 0.5, 0.3, 0.1 ), the binomial distribution is near to the normal distribution.

(p=0.001, 0.0001) の グラフを表示するエリアを変えて確認してみます。

正規分布よりもポアソン分布のほうが2項分布に近くなっているのがわかるでしょうか。 基本的に (p) がとても小さい場合、 正規分布では全ての確率を足した時に1になるようにするために、 (x = np) のときの確率が1より高くする必要が出てきます。 1より高いと確率の関数として成り立ちませんから、 (p) があまりにも小さい場合は正規分布は2項分布からずれてきます。

(n=1000)

(n = 1000) の場合のグラフは次のようになります。

これも右から (p = 0.5), (p = 0.3), (p = 0.1) のグラフとなっています。 2項分布と正規分布はまさに瓜二つですね。 ポアソン分布は確実にずれていることがわかります。

(p= 0.001, 0.0001) のグラフを表示します。

正規分布もポアソン分布もどちらも似ていますが、 どちらかというとポアソン分布のほうが2項分布に近いですね。

(n=10000)

(p=0.01) 以上 の場合は2項分布と正規分布がそっくりになることがわかりました。 (n=10000, p = 0.001 ) の場合のグラフを比較してみます。

ここまでくると正規分布でもわずかな差になっていますが、やはりポアソン分布のほうが2項分布に似ていますね。 似ているというよりそっくりです。

(p=0.0001) の場合も見てみます。

こちらも正規分布が似てきていますが、ポアソン分布のほうが2項分布に近いですね。

(n=100000)

(p=0.0001) でも (n=100000) だったら正規分布も2項分布にそっくりになるかもしれません。 比較してみましょう。

実際には正規分布を使ってもいいのかもしれませんが、ポアソン分布のほうが2項分布に近いです。 (n) を大きくして比較してきましたが、(p)が小さければポアソン分布のほうが2項分布に近いんですね。

(n=50)

(p geq 0.01) では 2項分布に近いように見えた正規分布ですが、 (n) を小さくしても2項分布に近い値を出すのでしょうか。 (n=50) で比較してみます。

(n=100) の時に比べれば 2項分布と正規分布の差は開いていますが、 まだまだだいぶ似ている感じがします。

(n=20)

(n=20) の場合にも見てみましょう。

(p=0.1) のグラフはズレが大きいですね。 (p geq 0.03) ではまだ近似として正規分布が使えそうです。

(n=10)

(n=10) の場合も見てみましょう。

(p=0.03) のところもズレが大きくなり始めましたが、 (n=10) でも (p) の値によっては近似として使えそうな印象です。

以上、正規分布、ポアソン分布、2項分布の差を視覚的に表示しました。 特に、 (p) が小さい場合は正規分布よりもポアソン分布のほうが2項分布に近くなることが視覚的にわかりましたね。