大数の法則のシミュレーション

Table of Contents

シミュレーションはときに直感的な理解の助けとなります。難しいことを理解するときには例を考えるのがいいのですが、手近に簡単なサンプルが見つからない場合はプログラムを使ってサンプルを作ってしまう、シミュレーションをするのがおすすめです。

大数の法則についても、プログラムでシミュレーションができます。たとえば (x in [0, 3)) を定義域で ([0, 1)) が値域の関数 ( g(x) = frac{1}{4} x(3-x)(x-0.75)^2) を考えてみましょう。 ((g(x)) は (int _0 ^1 g(x) dx neq 1) とならないので、確率密度関数ではありません。確率変数 (x) をプログラムでランダムに生成するために使う関数です。)

つぎの R のスクリプトで (g(x)) を描画できます。

g <- function(x) {x * (3 - x) * (x - 0.75) * (x - 0.75) / 4}
x <- (0:300)/100
gy <- g(x)
plot(x, gy, type='l')

g <- function(x) {x * (3 - x) * (x - 0.75) * (x - 0.75) / 4}

x <- (0:300)/100

gy <- g(x)

plot(x, gy, type='l')

Suppose (x = 0, 0.01, 0.02, cdots , 2.99, 3), then P((x) = g(x) / (sum ^ {300} _ {k=0} g(100k) )).

s <- sum(gy)
P <- function(x) { g(x) / s }
y <- P(x)
m <- sum(x * y)
v <- sum((x - m) * (x - m) * y)

s <- sum(gy)

P <- function(x) { g(x) / s }

y <- P(x)

m <- sum(x * y)

v <- sum((x - m) * (x - m) * y)

ここで m は期待値、 v は分散で、 m が 2.16665 、 v が 0.2341004 です。

標本分布のテストをするために、次の関数を使います。

pick <- function() {
candidate = NA
while (TRUE) {
candidate = round(runif(1, 0, 3), 2)
p = runif(1, 0, 1)
if (p < g(candidate)) break
}
candidate
}
sample_average <- function(n) {
v = 0
for (i in 1:n) { v = v + pick() }
v / n
}
generate_distribution <- function(n) {
r <- (0:300) * 0
for (i in 1:10000) { r[i] = sample_average(n) }
table(r) / 10000
}