統計学実践ワークブック 10章 サンプルサイズ 求め方

今日は第10章「検定の基礎と検定法の導出」について学んだことを記載していこうと思う。
この章に関して言えば統計検定2級プラスαのようなイメージを持っているが、p値やサンプルサイズなど統計において重要な部分が含まれている。

・P値って統計の勉強をしていると必ず出てくる単語だ。
しかし、会社で周りの人の話を聞いているとP値をしっかりわかっている人って意外と少ない。
P値は現在目の前で観察された事象よりも同じかそれよりも稀な事象が起こる確率であることだよね。
ここでよく混同されるのが有意水準。
有意水準→検定前に設定されるもの
P値→データが観測されて初めて計算できる値

だから「有意になりそう〜」といった理由でデータを見ながら有意水準を決めることは御法度ということ。大学入って研究し始めた時に良くやりがちな間違いである。実際私自身もそんなことをやっていたような気がする。今思うとあり得ないことだなと反省である・・・泣

ワークブック一周目ではサンプルサイズ設計がイマイチ理解できなかったのですが、
今回でなんとなくわかった気がします。

サンプルサイズの設計とは「帰無仮説H0の山」と「対立仮説H1の山」を十分に離して、第一種の過誤αと検出力1-βをのバランスを取って決めるものと理解しました。
自分の中ではそう理解したと言う感じです。
なので片側有意水準2.5%の時の棄却限界域1.96と第二種の過誤の確率β=0.2(検出力0.8)に相当する正規分位点の値である0.84を足したものが対立仮説における検定統計量z0の期待値になると言うことが理解できました。

ワークブック中々一回では理解するのは難しいですね…

でも合格するために仕事の合間を縫って精進していきたいと思います。


コメント

タイトルとURLをコピーしました