指数分布とその平均・分散


指数分布についてまとめました。

定義

正数 λ を用いて 確率密度関数 f(x) が 次のように表される確率分布を指数分布と言います。

f(x)={0(x0)λeλx(0<x)

確率変数 X が 指数分布に従うとき、 X Exponential(λ) と書きます。

複数回起きる現象があり、現象が起きてから次に現象が起きるまでの時間を X, その期待値を 1λ と定めた場合の分布です。 期待値を決めることで、自動的に確率分布が決定されます。

具体例

台風が過ぎ去ってから次の台風が来るまでの時間 X とその期待値 1λ

トイレに行ってから次にトイレに行くまでの時間 X とその期待値 1λ

期待値

指数分布の期待値は次のように計算されます。

E(X)=xf(x)dx=0xf(x)dx+0xf(x)dx=0+0xf(x)dx=0xf(x)dx=0λxeλxdx

ここで t=λx とします。 x=tλ です。

E(X)=0tetdxdtdt=0tet{ddt(tλ)}dt=1λ0tetdt=1λ0tetdt=1λ[et+tet]0=1λ{(00)(1+0)}=1λ

分散

指数分布の分散は次のように計算されます。

V(X)=(x1λ)2f(x)dx=0(x1λ)2f(x)dx=0λ(x1λ)2eλxdx

ここで t=λx とします。 x=tλ です。

V(X)=01λ(t+1)2etdxdtdt=01λ(t+1)2et{ddt(tλ)}dt=1λ20(t+1)2etdt=1λ20(t2+2t+1)etdt=1λ2[(t2et2tet+2et)+(2tet2et)+et]0=1λ2[t2et+et]0=1λ2{(0+0)(0+1)}=1λ2

X の尺度は確率に影響しない

たとえば、台風が来るまでの時間を確率変数として、年で表したものを Xyear、日で表したものを Xday とします。 便宜的に、1年を365.25日とすると、 λyear=365.25λday となります。

このとき、 Xyear が 2年以下になる確率は Xday365.25×2=730.5 以下になる確率と同じです。 尺度に関わらず、指数分布に従うとした場合、確率変数の意味する範囲が同じであれば同じ確率になります。

XaExponential(λa), XbExponential(λb) とします。 xa は尺度を変えると cxb に相当するものとします。 先ほどの年と日の例で言えば、 c=365.25 です。 このとき、期待値について 1cλa=1λb の関係となりますから、 cλa=λb となります。

このとき

P(cαxacβ)=cβcαλaeλaxadxa=βαλaecλaxbdxadxbdxb=βαcλaecλaxbdxb=βαλbeλbxbdxb=P(αxbβ).

R での計算

R で指数分布を計算するには dbinom, pbnom を使います。

dexp
dexp(x, l)XExponential(l) なる X について P(X=x) を計算します。
pexp
pexp(x, l)XExponential(l) なる X について P(Xx) を計算します。
qexp
qexp(p, l)XExponential(l) なる X について P(Xp)p となる最小の X を計算します。
rexp
rexp(n, l)XExponential(l) なる Xn 個 ランダムに抽出します。。