高専4年の数学の教科書として使用した「新 確率統計」(大日本図書) の公式などを備忘録としてまとめたものです。
1. 確率
条件付き確率 (ベイズの定理)
Aが起こったという条件のもとでBの起こる条件つき確率
PA(B)=P(A)P(A∩B)
P(B∣A)=P(A)P(A∣B)P(B)
反復試行の確率
試行 T を1回行うとき、A の起こる確率を p とする。この試行を独立に n 回行うとき、A が k 回起こる確率は次式で求まる。
nCkpkqn−k(q=1−p,k=0,1,2,...,n)
2. データの整理
1次元のデータ
平均
x=n1i=1∑nxi
分散
vx=n1i=1∑n(xi−x)2=x2−x2
標準偏差
sx=vx
2次元のデータ
共分散
sxy=n1i=1∑n(xi−x)(yi−y)=xy−xy
相関係数
r=sxsysxy=i=1∑n(xi−x)2i=1∑n(yi−y)2i=1∑n(xi−x)(yi−y)
回帰直線
(y=ax+b)
a=sx2sxy,b=y−ax
3. 確率分布
確率変数と確率分布
確率変数と確率分布
|
離散型 |
連続型 |
確率分布 |
P(X=xi)=pi |
P(a≤X≤b)=∫abf(x)dx |
平均 μ=E[X] |
i=1∑nxipi |
∫−∞∞xf(x)dx |
分散 σ2=V[X] |
i=1∑n(xi−μ)2pi |
∫−∞∞(x−μ)2f(x)dx |
平均と分散の性質
E[aX+b]=aE[x]+b,V[aX+b]=a2V[X]
V[X]=E[X2]−(E[X])2
主な離散型確率分布
二項分布B(n,p)ポアソン分布Po(λ)P(X=k)=nCkpkqn−kP(X=k)=e−λk!λk平均np,分散npq平均λ,分散λ
確率密度関数と分布関数
∫−∞∞f(x)dx=1
F(x)=∫−∞xf(x)dx=P(X≤x)... 分布関数
正規分布 N(μ,σ2)
f(x)=2πσ1exp(−2σ2(x−μ)2)
X は N(μ,σ2) に従う ⟹ X の標準化 Z=σX−μ は標準正規分布 N(0,1) に従う
二項分布の正規分布による近似
X は B(n,p)、Z は N(0,1) に従うとき、nが十分に大きいならば
P(a≤X≤b)≃P(npqa−0.5−np≤Z≤npqb+0.5−np)
統計量の標本分布
統計量
無作為標本 X1,X2,…,Xn の関数
標本平均
X=n1i=1∑nXi
標本分布
S2=n1i=1∑n(Xi−X)2
不偏分散
U2=n−11i=1∑n(Xi−X)2=n−1nS2
標本平均の平均と分散
E[X]=μ,V[X]=nσ2
正規母集団 N(μ,σ2) の標本分布
大きさnの無作為標本の標本平均 X は N(μ,nσ2) に従う
中心極限定理
母平均 μ、母分散 σ2 の母集団から大きさ n の無作為標本を抽出
⟹ n が大きいとき、X は近似的に正規表現 N(μ,nσ2) に従う
χ2 分布
上限 α 点 χn2(α) ⟺ P(X≥χn2(α))=α
正規母集団 N(μ,σ2) から大きさ n の無作為標本を抽出
⟹ σ2(n−1)U2 は自由度 n−1 の χ2 分布に従う
t 分布
上限 α 点 tn(α) ⟺ P(X≥tn(α))=α
正規母集団 N(μ,σ2) から大きさ n の無作為標本を抽出
⟹ U2/nX−μ は自由度 n−1 の t 分布に従う
F 分布
上限 α 点 Fm,n(α) ⟺ P(X≥Fm,n(α))=α
N(μ1,σ2),N(μ2,σ2) から大きさ n の無作為標本を抽出
⟹ U22U12 は自由度 (n1−1,n2−1) の F 分布に従う
4. 推定と検定
母平均の区間推定
正規母集団で母分散 σ2 が既知のとき(ただし,zα/2 は標準正規分布の上側 α/2 点)(正規母集団でなくても n が大きければ、σ2 に不偏分散 u2 を代入しても良い)
x−zα/2nσ2≤x≤x+zα/2nσ2
正規母集団で母分散 σ2 が未知のとき
x−tn−1(α/2)nu2≤x≤x+tn−1(α/2)nu2
母分散の区間推定
正規母集団のとき
χn−12(α/2)(n−1)u2≤σ2≤χn−12(1−α/2)(n−1)u2
母比率の区間推定
二項母集団で n は大きいとき
p^−zα/2np^(1−p^)≤p≤p^+zα/2np^(1−p^)
統計的検定
仮説と検定
- 有意水準(危険率)α を定める。
- 帰無仮説 H0 と対立仮説 H1 を設定する。
- H0 : θ=θ0
- H1 : θ=θ0 (両側検定) θ>θ0 (右側検定) θ<θ0 (左側検定)
- H0 を仮定して、検定統計量 X の実現値 x を求める。
- p 値または棄却域の方法により、H0 を棄却するかどうかを判断する。
- p 値 … X が x より外れる確率(α より小さければ棄却)
- 棄却域 … 棄却域に入る確率が α となる X の範囲
|
H0 が真 |
H0 が偽 (H1 が真) |
H0 を受容 |
正しい判断 |
第2種の誤り |
H0 を棄却 |
第1種の誤り |
正しい判断 |
色々な検定
検定 |
前提条件 |
検定統計量 |
確率分布 |
母平均 |
正規母集団で 母分散が既知 |
Z=σ2/nX−μ |
標準正規分布 |
母平均 |
正規母集団で 母分散が未知 |
T=U2/nX−μ |
自由度 n−1 の t 分布 |
母平均 |
n が大きい |
Z=U2/nX−μ |
近似的に標準正規分布 |
母分散 |
正規母集団 |
X=σ02(n−1)U2 |
自由度 n−1 の χ2 分布 |
等分散 |
正規母集団 |
F=U22U12,F′=U12U22 |
自由度 (n1−1,n2−1) の F 分布 |
母平均の差 |
正規母集団で 母分散が既知 |
Z=σ12/n1+σ22/n2X−Y |
標準正規分布 |
母平均の差 |
n1,n2 が大きい |
Z=U12/n1+U22/n2X−Y |
近似的に標準正規分布 |
母比率 |
二項母集団で n が大きい |
Z=p0q0/nP^−p0 |
近似的に標準正規分布 |
参考文献