レバレッジとCookの距離

本日の成果

本日の成果は
ワークブックの17章です。
会社前の1時間マックで勉強しました。
なんとか1時間勉強時間を確保できたという感じです。

今のブログを書く時間は、朝勉強したことの復習にしようかなと、、、

回帰診断なんですが、一周目は分かったつもりだったんですが
全く分かっていなかったですね。

かなり奥深いなって感じました。

ハット行列について

レバレッジ(てこ比)を語る際に、ハット行列って出てきますよね!?
このハット行列ってめちゃくちゃ奥深くてハッとしましたね。。。
(ハット行列だけに笑)

観測されたデータを予測された値に変換する行列だからハット行列っていうみたいです。

このハット行列がレバレッジに関わってくるのですが、直感的なものとしては
①ハット行列H=(XXT)XTにXが含まれる
②対角成分hiiが大きいほど、Xが平均的な説明変数の値から離れている(外れた説明変数)
③そのため、その点を少し動かすだけで回帰直線の傾きが変わりやすい

→しかし、あくまでXの位置的な意味での「ポテンシャル」なのでCookの距離と合わせて見ることが大事!
ってことでレバレッジとCookの距離はセットで考えるということですね。

コメント

タイトルとURLをコピーしました