お疲れ様です。
今日の勉強時間は出社前の1時間30分でした。
中々勉強時間取れませんね( ; ; )
今日は11章の「正規分布に関する検定」と12章の「一般の分布に関する検定法」をやりました。11章については徐々に理解できてきたかなぁという感じです。
基本的に頭の中を整理するとまず以下の2つに分ける。
- 1標本
- 2標本
その後、
- 1標本の時、検定統計量は
- 分散が既知の場合→既知の分散を利用
- 分散が未知の場合→不偏分散を利用
- 2標本の時、検定統計量は
- 分散が既知の場合→既知の分散を利用
- 分散が未知の場合→プールした分散を利用
といった感じで解くようにしています。
12章については
中々、適合度検定のイエーツ補正がピンとこないんですよね。
自分なりに整理をすると以下の通りです。
イエーツ補正はどんな時に使うか
サンプル数が少ない時で、具体的には5未満の時。
なぜイエーツ補正をするのか?
離散データをカイ二乗分布に近似する場合を考える。
近似するということはサンプルサイズが十分にあるという設定。(離散でも連続に近くなる)
しかし、サンプルサイズが小さいということは連続近似の誤差が目立つのでイエーツ補正を行う。
理論上の「連続的な」ズレは、
例えば1 と 2 を考えたときにその間には「中間領域」があります。(1.5など)
でも実際には「整数」でしか観測されないので、
理論値より常にちょっとズレが大きめに計算される。
そこで0.5を引くことで
「本当ならこのくらい連続的に近づけるはず」
という分を差し引いて、
「離散の世界」と「連続の世界」をつなげる補正をする。
O:観測値
E:期待同数
としたときに、カイ二乗統計量の分子が
(|O-E|-0.5)2となるのは控えめにズレを見積もることになる。
要するに有意になりにくくなり、保守的になるということですね。
上記のようにサンプル数が少ないと「偶然のズレ」を過大評価しやすいため、
イエーツ補正をするのですね。
明日も出社前に頑張ります。
おやすみなさい。

コメント