日大工 総合教育 樋口幸治郎
ホーム | 教室 | 研究室 |
---|---|---|
統計学 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
確率変数の平均と分散を学ぶ(教科書p87-96).
定義 離散型確率変数$X$が $$x_1,x_2,x_3,...$$ という値を取り, それらの確率が $$p_1,p_2,p_3,...$$ であるとする. このとき, 平均$\mu$(期待値$E(X)$ともいう)と分散$V(X)$と標準偏差$\sigma(X)$を $$\mu=E(X)=\sum_ix_ip_i\qquad V(X)=E((X-\mu)^2)=\sum_{i}(x_i-\mu)^2p_i\qquad\sigma(X)=\sqrt{V(X)}$$ と定める.
定義 連続型確率変数$X$の確率密度関数を$f(x)$とするとき, 平均$\mu$(期待値$E(X)$ともいう)と分散$V(X)$と標準偏差$\sigma(X)$を $$\mu=E(X)=\int^\infty_{-\infty}xf(x)dx\qquad V(X)=E((X-\mu)^2)=\int^\infty_{-\infty}(x-\mu)^2f(x)dx\qquad\sigma(X)=\sqrt{V(X)}$$ と定める.
定理 確率変数$X$について $$V(X)=E(X^2)-E(X)^2$$ が成り立つ.
証明 離散型の場合. $$\begin{align} &V(X)=\sum_{i}(x_i-\mu)^2p_i=\sum_i(x_i^2p_i-2x_i\mu p_i+\mu^2p_i) =\sum_ix_i^2p_i-\sum_i2x_i\mu p_i+\sum_i\mu^2p_i\\ =&\sum_ix_i^2p_i-2\mu\sum_ix_i p_i+\mu^2\sum_ip_i =E(X^2)-2E(X)^2+E(X)^2\cdot 1 =E(X^2)-E(X)^2 \end{align}$$ 連続型の場合. $$\begin{align} &V(X)=\int^\infty_{-\infty}(x-\mu)^2f(x)dx =\int^\infty_{-\infty}(x^2f(x)-2x\mu f(x)+\mu^2f(x))dx =\int^\infty_{-\infty}x^2f(x)dx-\int^\infty_{-\infty}2x\mu f(x)dx+\int^\infty_{-\infty}\mu^2f(x)dx\\ =&\int^\infty_{-\infty}x^2f(x)dx-2\mu\int^\infty_{-\infty}xf(x)dx+\mu^2\int^\infty_{-\infty}f(x)dx =E(X^2)-2E(X)^2+E(X)^2\cdot 1 =E(X^2)-E(X)^2 \end{align}$$
定理 確率変数$X$の平均$\mu$, 標準偏差$\sigma$に対し, 任意の$\lambda>0$に対し, $$P(|X-\mu|\ge\lambda\sigma)\le\dfrac{1}{\lambda^2}$$ が成り立つ. 言い換えれば $$P(|X-\mu|<\lambda\sigma)\ge 1-\dfrac{1}{\lambda^2}$$ である.
証明
離散型の場合.
$$\begin{align}
&\sigma^2
=\sum_{i}(x_i-\mu)^2p_i
=\sum_{i\in I_{\ge\lambda\sigma}}(x_i-\mu)^2p_i+\sum_{i\in I_{<\lambda\sigma}}(x_i-\mu)^2p_i\\
\ge&\sum_{i\in I_{\ge\lambda\sigma}}(x_i-\mu)^2p_i
\ge\sum_{i\in I_{\ge\lambda\sigma}}(\lambda\sigma)^2p_i\\
=&(\lambda\sigma)^2\sum_{i\in I_{\ge\lambda\sigma}}p_i
=(\lambda\sigma)^2P(|X-\mu|\ge\lambda\sigma)
\end{align}$$
となる.
よって, 最左辺と最右辺を$(\lambda\sigma)^2$で割れば,
$$P(|X-\mu|\ge\lambda\sigma)\le\dfrac{1}{\lambda^2}$$
が得られる.
連続型の場合.
$$\begin{align}
&\sigma^2
=\int^\infty_{-\infty}(x-\mu)^2f(x)dx
=\int^{\mu-\lambda\sigma}_{-\infty}(x-\mu)^2f(x)dx+\int^{\mu+\lambda\sigma}_{\mu-\lambda\sigma}(x-\mu)^2f(x)dx+\int^\infty_{\mu-\lambda\sigma}(x-\mu)^2f(x)dx\\
\ge&\int^{\mu-\lambda\sigma}_{-\infty}(x-\mu)^2f(x)dx+\int^\infty_{\mu-\lambda\sigma}(x-\mu)^2f(x)dx
\ge\int^{\mu-\lambda\sigma}_{-\infty}(\lambda\sigma)^2f(x)dx+\int^\infty_{\mu-\lambda\sigma}(\lambda\sigma)^2f(x)dx\\
=&(\lambda\sigma)^2\int^{\mu-\lambda\sigma}_{-\infty}f(x)dx+(\lambda\sigma)^2\int^\infty_{\mu-\lambda\sigma}f(x)dx
=(\lambda\sigma)^2P(|X-\mu|\ge\lambda\sigma)
\end{align}$$
となる.
よって, 最左辺と最右辺を$(\lambda\sigma)^2$で割れば,
$$P(|X-\mu|\ge\lambda\sigma)\le\dfrac{1}{\lambda^2}$$
が得られる.