指数分布とその平均・分散


指数分布についてまとめました。

定義

正数 \(\lambda\) を用いて 確率密度関数 \(f(x)\) が 次のように表される確率分布を指数分布と言います。

\[ f(x) = \begin{cases} 0 & (x \leq 0) \\ \lambda e ^{- \lambda x} & (0 \lt x) \end{cases} \]

確率変数 \(X\) が 指数分布に従うとき、 \( X ~ \textrm{Exponential}(\lambda) \) と書きます。

複数回起きる現象があり、現象が起きてから次に現象が起きるまでの時間を \(X\), その期待値を \(\frac{1}{\lambda}\) と定めた場合の分布です。 期待値を決めることで、自動的に確率分布が決定されます。

具体例

台風が過ぎ去ってから次の台風が来るまでの時間 \(X\) とその期待値 \(\frac{1}{\lambda}\)。

トイレに行ってから次にトイレに行くまでの時間 \(X\) とその期待値 \(\frac{1}{\lambda}\)。

期待値

指数分布の期待値は次のように計算されます。

\begin{eqnarray} \textrm{E}(X) & = & \int _{-\infty} ^{\infty} x f(x) dx \\ & = & \int _{-\infty} ^{0} x f(x) dx + \int_0 ^{\infty} x f(x) dx \\ & = & 0 + \int_0 ^{\infty} x f(x) dx \\ & = & \int_0 ^{\infty} x f(x) dx \\ & = & \int_{0}^{\infty} \lambda x e^{-\lambda x} dx \end{eqnarray}

ここで \(t = -\lambda x\) とします。 \(x = – \frac{t}{\lambda} \) です。

\begin{eqnarray} \textrm{E}(X) & = & \int_{0}^{-\infty} -t e^{t} \frac{dx}{dt} dt \\ & = & \int_{0}^{-\infty} -t e^{t} \left\{ \frac{d}{dt} \left(- \frac{t}{\lambda} \right) \right\} dt \\ & = & – \frac{1}{\lambda} \int_{0}^{-\infty} -t e^{t} dt \\ & = & \frac{1}{\lambda} \int_{0}^{-\infty} t e^{t} dt \\ & = & \frac{1}{\lambda} \left[ -e^t + t e^t \right]_0^{-\infty} \\ & = & \frac{1}{\lambda} \left\{ \left( – 0 – 0 \right) – \left( – 1 + 0 \right) \right\} \\ & = & \frac{1}{\lambda} \end{eqnarray}

分散

指数分布の分散は次のように計算されます。

\begin{eqnarray} \textrm{V}(X) & = & \int _{-\infty} ^{\infty} \left( x – \frac{1}{\lambda} \right) ^2 f(x) dx \\ & = & \int _{0} ^{\infty} \left( x – \frac{1}{\lambda} \right) ^2 f(x) dx \\ & = & \int _{0} ^{\infty} \lambda \left( x – \frac{1}{\lambda} \right) ^2 e^ {-\lambda x} dx \end{eqnarray}

ここで \(t = -\lambda x\) とします。 \(x = – \frac{t}{\lambda} \) です。

\begin{eqnarray} \textrm{V}(X)& = & \int _{0} ^{-\infty} \frac{1}{\lambda} \left(t +1 \right)^2 e^{t} \frac{dx}{dt} dt \\ & = & \int _{0} ^{-\infty} \frac{1}{\lambda} \left(t +1 \right)^2 e^{t} \left\{\frac{d}{dt} \left( – \frac{t}{\lambda} \right) \right\} dt \\ & = & -\frac{1}{\lambda ^ 2} \int _{0} ^{-\infty} \left(t +1 \right)^2 e^{t} dt \\ & = & -\frac{1}{\lambda ^ 2} \int _{0} ^{-\infty} \left( t^2 + 2t + 1 \right) e^t dt \\ & = & -\frac{1}{\lambda ^ 2} \left[ \left( t^2 e^t – 2te^t + 2e^t \right) + \left(2te^t – 2e^t \right) + e^t \right]_0^{-\infty} \\ & = & -\frac{1}{\lambda ^ 2} \left[ t^2 e^t + e^t \right]_0^{-\infty} \\ & = & -\frac{1}{\lambda ^ 2} \left\{ \left( 0 + 0 \right) – \left( 0 + 1 \right) \right\} \\ & = & \frac{1}{\lambda^2}\end{eqnarray}

\(X\) の尺度は確率に影響しない

たとえば、台風が来るまでの時間を確率変数として、年で表したものを \(X_\textrm{year}\)、日で表したものを \(X_\textrm{day}\) とします。 便宜的に、1年を365.25日とすると、 \(\lambda_\textrm{year} = 365.25 \lambda_\textrm{day}\) となります。

このとき、 \(X_\textrm{year}\) が 2年以下になる確率は \(X_\textrm{day}\) が \(365.25 \times 2 = 730.5\) 以下になる確率と同じです。 尺度に関わらず、指数分布に従うとした場合、確率変数の意味する範囲が同じであれば同じ確率になります。

\(X_a \sim \textrm{Exponential}(\lambda_a)\), \(X_b \sim \textrm{Exponential}(\lambda_b) \) とします。 \(x_a \) は尺度を変えると \( c x_b \) に相当するものとします。 先ほどの年と日の例で言えば、 \( c = 365.25 \) です。 このとき、期待値について \(\frac{1}{c \lambda_a} = \frac{1}{\lambda_b} \) の関係となりますから、 \(c \lambda_a = \lambda_b\) となります。

このとき

\begin{eqnarray} \textrm{P}(c \alpha \leq x_a \leq c \beta) & = & \int _{c \alpha} ^{c \beta} \lambda _a e^{-\lambda_a x_a} dx_a \\ & = & \int _{\alpha}^{\beta} \lambda _a e^{- c \lambda_a x_b} \frac{d x_a}{d x_b} dx_b \\ & = & \int _{\alpha}^{\beta} c \lambda _a e^{- c \lambda_a x_b} dx_b \\ & = & \int _{\alpha}^{\beta} \lambda _b e^{- \lambda_b x_b} dx_b \\ & = & \textrm{P}(\alpha \leq x_b \leq \beta). \end{eqnarray}

R での計算

R で指数分布を計算するには dbinom, pbnom を使います。

dexp
dexp(x, l) は \(X \sim \textrm{Exponential}(l) \) なる \(X\) について \(P(X = x)\) を計算します。
pexp
pexp(x, l) は \(X \sim \textrm{Exponential}(l) \) なる \(X\) について \(P(X \leq x)\) を計算します。
qexp
qexp(p, l) は \(X \sim \textrm{Exponential}(l) \) なる \(X\) について \(P(X \leq p) \geq p \) となる最小の \(X\) を計算します。
rexp
rexp(n, l) は \(X \sim \textrm{Exponential}(l) \) なる \(X\) を \(n\) 個 ランダムに抽出します。。