【概要】
僕が統計における検定の評価基準と問題点を把握するためのメモ
※きっと,読者の方には得るものはないと思いますw
【疑問】
検定の評価の仕方には大きな問題点があるらしい.その問題点とは?
【前回の復習】
前回の記事[https://my-occupational-life.com/?p=44]で,検定が統計における仮説検定モデルを評価する指標であることがわかった.要は,検定という作業を通して自分が想定した仮説が正しいかを証明するらしい.
【今回覚えたこと】
検定は主に帰無仮説の可能性を“評価”するために用いられている.
p値が小さい⇨帰無仮説の可能性が小さい⇨帰無仮説を棄却⇨対立仮説が正しい,的な.※これ自体も,本当は間違っているらしいが今回はスルーします.
p値のみで仮説を判断すると,以下の問題が起きるらしい.
〈よく見る判断例とそれに伴う問題〉
・p値が0.05以下であるため,帰無仮説を棄却し,対立仮説を採用した.
⇨そもそも,この0.05という基準になんの根拠もない.
⇨帰無仮説の可能性が低いだけで,完全否定はできていない.
⇨別の帰無仮説の可能性も否定できない.
⇨目的に挙げた対立仮説ではなく,別の仮説の可能性がある.
・p値が0.05以上であるため,帰無仮説は棄却されない.
⇨対立仮説より帰無仮説の方が正しい確率が高いだけで,対立仮説を完全否定できない
⇨別の帰無仮説の可能性も否定できない
ということらしいです.
なんでこのようなことが起こるかというと,僕が思うに統計は次の基本条件の上で行われるからだと思います.
・統計は,母集団から集めた一部のデータを使って,母集団に対する仮説を調べているから!!そして,完璧な母集団全てのデータは手に入ることはなく,母集団の真の姿はわからないから!!
つまりは,どんなに確率が高くとも,あくまで“集めた一部のサンプルで確率が高いだけ”な訳です.そして,真実の答えも不明なので,確率が高くても正しいとは言えないのです.
【次への展開】
次回は,検定以外の評価法について書きたいと思います〜
このblogは僕自身の思考を残すために書いてます.そのため,みなさまへ貢献できることはないですが,みなさまからの指摘はウェルカムですので,よろしくデスゥ〜!
さよならさようならさよなら