【ちゃんと使い分けられていますか?】パラメトリック検定とノンパラメトリック検定の違いは?使い分け方も解説!

群間の平均値や分布を比較するときには仮説検定が用いられます。

実は仮説検定は大きく2種類に分類されることを知っていますか?

それはパラメトリック検定ノンパラメトリック検定の2種類。
パラメトリック検定とノンパラメトリック検定の違いはp値を計算するときに、
前提とする分布があるかどうかです。

この記事では
パラメトリック検定とノンパラメトリック検定の違いは何なのか
パラメトリック検定とノンパラメトリック検定はどのように使い分けるのか
について解説します!

仮説検定とは?

仮説検定とは?

初めに仮説検定について簡単に復習しておきましょう!

仮説検定とは仮説がデータに基づいて妥当かどうかを判定する統計学的手法のことです。

多くの場合、証明したい仮説を対立仮説、対立仮説と反対の仮説を帰無仮説とします。
仮説検定では、この帰無仮説の下で、得られたどれだけデータが珍しいか、を評価します
この「得られたどれだけデータが珍しいか」がp値であり、
珍しいと判断する基準を有意水準と呼びます。

もし帰無仮説の下で珍しい結果である=p値が有意水準より小さいときには、
帰無仮説は棄却して対立仮説を採択します。

実際に仮説検定の流れを見てみましょう!

仮説検定の手順

例えば、「2つのクラスで身長の平均値の差があるか」を調べたいとします。

このとき、帰無仮説は「2つのクラスで身長の平均値の差がない」
対立仮説は「2つのクラスで身長の平均値の差がある」となります。
次に「2つのクラスの身長の平均値に差がない」とした下で、
実際に得られた2つのクラスで身長の平均値の差がどれだけ珍しいかを評価します。

もし有意水準を5%として、珍しら(p値)が0.01であれば、帰無仮説を棄却して「2つのクラスで身長の平均値の差がある」と結論付けます。

パラメトリック検定とノンパラメトリック検定の違いは?

パラメトリック検定とノンパラメトリック検定の違いは?

仮説検定の方法にはt検定やウィルコクソン順位和検定、カイ二乗検定やFisherの直接確率検定など様々な方法があります。
これらの検定手法はパラメトリック検定かノンパラメトリック検定のいずれかに分類されます

ではパラメトリック検定とノンパラメトリック検定の違いはなんでしょうか?
それはp値を計算する前提とする分布があるかどうかということ。

パラメトリック検定の場合は「データが正規分布に従っているか」など特定の分布に従っているかを前提としており、一方でノンパラメトリック検定の場合は特定の分布を前提としていない、という違いがあります。

パラメトリック検定とノンパラメトリック検定はどう使い分ける?

パラメトリック検定とノンパラメトリック検定はどう使い分ける?

パラメトリック検定の場合は特定の分布に従っているかを前提としており、ノンパラメトリック検定の場合は特定の分布を前提としていない、という違いがあります。

そのため、パラメトリック検定とノンパラメトリック検定の使い分けは
データの分布が前提にしている分布に従っているかどうかを確認して考えます。

例えば、平均値を比較したい場合、以下のような基準で判断することができます。

  • データが左右対称の釣鐘型で正規分布に従っている:t検定(パラメトリック検定)
  • 特定の分布に従わない(正規分布に従っていない):ウィルコクソン順位和検定(ノンパラメトリック検定)
パラメトリック検定とノンパラメトリック検定の使い分け

ただし、必ずしも厳密に正規分布に従っているかなど検定を使って調べる必要はなく、
ある程度従っているかを目視で確認することを忘れないようにしましょう!

そもそもパラメトリック検定とノンパラメトリック検定を使い分けるメリットは?

そもそもパラメトリック検定とノンパラメトリック検定を使い分けるメリットは?

そもそもパラメトリック検定とノンパラメトリック検定を使い分けるメリットはなんでしょうか?

一番のメリットは検出力が高くなるということ。

つまり、データに適した検定手法を選んであげることで、
本当に効果の差があるときに有意差があると判定されやすくなります

例えば、データが正規分布に従っているときには、ウィルコクソン順位和検定よりもt検定の方がp値が小さくなりますが、
データが正規分布に従っていないときには、t検定におけるt分布へのあてはめが正確に行えないので、ウィルコクソン順位和検定を用いた方がよい、ということになります。

そのため、事前にデータの分布を確認して適した検定を選んであげることが非常に重要です

まとめ

各記事のまとめ

今回はパラメトリック検定とノンパラメトリック検定の違いについて解説しました!

パラメトリック検定とノンパラメトリック検定の違いは
検定の数理的理論に前提とする特定の分布があるかどうかということでした。
パラメトリック検定は前提とする特定の分布があるのに対して、
ノンパラメトリック検定には前提とする分布がありません。

そのため、データの分布がどのような形状になっているかを解析の前に確認して
パラメトリック検定を使うのかノンパラメトリック検定を使うのかを判断しましょう!

コメント

タイトルとURLをコピーしました