検定とは、標本を基準として母集団の特徴や状態について何らかの仮説を設け、その妥当性を標本データ をもとに確率論的に検証する方法である。
帰無仮説を前提として矛盾が導かれた場合に、「差がある」とする仮説(対立仮説)を立証するた めに、仮定される。
2群の間の測定値を比較する場合は、両者の測定値に「差がない」とする仮説が帰無仮説となる。
両群の測定値に差があるとする仮説。
帰無仮説が正しいのに、それを誤って否定する確率を指す。医学の分野では、5% とされる。
仮説Hの下における確率の小さい事象、つまり仮説に対して疑いを持つような事象を有意な事象という。 有意な事象に伴う確率の大きさを有意水準という。通常は0.05を採用する。
すなわち第1種の誤りをどこまで許容するかのガイドライン。
検定結果が有意になる場合の有意水準。
左右対称な確率密度関数で中心より等距離の外側の確率を計算して、P値とする検定。
母集団の分布型に対して一定の仮定をおき、それに基づいて仮説検定を行う。
母集団の分布型に対して特定の仮定をおく必要がないもの。すなわち母数によらない統計。
「2群に差がない」とする帰無仮説H0を設定する。
検定しやすいように標本データを一つの数値に要約する。 このときどのような統計量にするかによって検定法が分れる。
帰無仮説のもとで、統計量Xが生じる確率Pを計算する。
その程度の差は起こりうるので、帰無仮説を棄却できない。
そのようなことは起こりにくいと考えて、帰無仮説を棄却し、対立仮説を採用する。
帰無仮説は正しいのに、たまたま確率の小さな事象が生じたために、帰無仮説を棄却する誤り。
帰無仮説は正しくないのに、算出された確率が小さくないために、帰無仮説を受容してしまう誤り。
χ2乗検定は2つ以上の群間の頻度や比率を比較する際に用いられる検定法である。 なおz検定はχ2乗検定と同等のP値を算出する。
![]() |
(47) |
次のような観察データあるとする。
| 心筋梗塞 | 対照群 | ||
| 経口避妊薬暴露 | 10 | 5 | 15 |
| 非暴露 | 10 | 35 | 45 |
| 20 | 40 | 60 |
仮説 H0: 「経口避妊薬と心筋梗塞のあいだには何ら関係はない」とたてる。
ここで全体として心筋梗塞に陥る確率は 20/60=1/3 だから、したがって仮説 H0 のもとで表を再作成すると
| 心筋梗塞 | 対照群 | ||
| 経口避妊薬暴露 | 5 | 10 | 15 |
| 非暴露 | 15 | 30 | 45 |
| 20 | 40 | 60 |
以上をもとにχ2乗統計量を計算する。
(+ (/ (^ (- 10 5) 2) 5) (/ (^ (- 5 10) 2) 10) (/ (^ (- 10 15) 2) 15) (/ (^ (- 35 30) 2) 30) )
![]() |
(48) |
標本群がすべて同一の母集団に由来するものであるか否かを調べるのに用いられる。 標本群相互の比較はできない点がt検定と異なる。 しかし通常のt検定と異なり、3群以上の標本群を処理できる。
に掲載された事例をxlispstatでシミュレートした。
母集団は正規分布であり、すべてのサンプルも正規分布から抽出しているので、F値は1に近似するはずである。
(let (
(result 0)
(count 2000)
(population-size 200)
(sample-size 7)
)
(dotimes (i count result)
(def population (normal-rand population-size))
(def control (normal-rand sample-size))
(def spaghetti (normal-rand sample-size))
(def steak (normal-rand sample-size))
(def fruit (normal-rand sample-size))
(def var-within (/ (+ (variance control) (variance spaghetti) (variance steak) (variance fruit))
4))
(def var-between (* sample-size
(variance (list (mean control) (mean spaghetti) (mean steak) (mean fruit)))))
(def f-value (/ var-between var-within))
(setf result (+ result f-value))
)
(/ result count)
)
平均に関して2標本群相互の比較を行なう検定法。標本サイズの異なる群の比較にも利用できる。 ただしそのままでは3群以上の標本群の中でそれぞれ2群を比較することはできない。
t統計量は2つの平均値の比較に用いられる。
![]() |
(49) | ||
![]() |
(50) | ||
![]() |
(51) |
2群の標本サイズが異なる場合に用いるt統計量。
![]() |
(52) |
![]() |
(53) |
3群以上の標本群の比較に利用される。
![]() |
(54) |
![]() |
(55) |
| (56) |