Mail News Archives
 検索
   
SQC(統計とビッグデータ)
SQC

ノンパラメトリック法<2018年01月25日>

 今回はノンパラメトリック法について簡単に振り返りたいと思います。ノンパラメトリック法という言葉だけを聞くと、難しいように聞こえがちですが、ポイントを押さえておくと、いくつかのノンパラメトリック手法は簡単に使えることができますので、これを機会にぜひ学習してみ下さい。
 

■パラメトリック法とノンパラメトリック法


 ノンパラメトリックという言葉があるからにはパラメトリックという言葉もあります。パラメトリック法とは母集団の分布が何らかのある分布に従っていると仮定し、その母数に対して、統計的推測を行う方法のことを言います。多くの場合は正規分布に従っていることを仮定し、統計的推測を行います。
 これに対してノンパラメトリック法とは母集団に一切の分布を仮定しない場合の統計解析手法です。一切の分布を仮定しないので、サンプルのデータを直接用いず、各データの大小の順位情報を用いて解析します。
 

■ノンパラメトリック法の特長

 ノンパラメトリック法の特長として大きく3つ挙げられ、全て順位データを用いることに因る特長です。
 第1に、データがなくとも、分類データや順位データしか得ることができない場合にも適用することができます。官能検査など、品質の良さ・グレードで分類されたデータや順位づけられたデータに対して、ノンパラメトリック法を用いることで解析が可能です。
 次に、特定の分布に仮定する必要がないことです。過去のデータの蓄積により、正規性が確認されている場合は、解析において正規性の仮定をおくことは妥当ですが、正規性の確認が不十分で、グラフ化して分布の形状を確認せず自動的に解析を行うと危険です。
 3つ目に外れ値の影響を受けにくいということです。先述の通り、ノンパラメトリック法ではデータを直接用いず、順位データを用いて解析を行うので、たとえ大きくデータが外れていたとしても、順位データとして処理するので、その影響をあまり受けません。
 ノンパラメトリック法ではこのような利点を持ちますので、非常に有用ですが、パラメトリック法と比べると、データを直接用いず順位データに変換して用いる分、情報を一部ロスしているために感度がやや劣ります。
 

■ノンパラメトリック検定

 順位データや分類データを扱うノンパラメトリック法は直感的に理解しやすく、適用が簡単である検定もいくつかありますので、ここではその代表的な検定法を紹介しそのポイントについて振り返ります。
 以下の表に、代表的なパラメトリック検定に対応したノンパラメトリック法をまとめました。ばらつきに関する検定もノンパラメトリック法でムッドの検定という方法がありますが、SQCの現場では適用の場が多くありません。


 
表. パラメトリック検定に対応したノンパラメトリック検定
2つの母集団に
関する推測
対応のない場合 対応のある場合 相関分析
パラメトリック法 スチューデントのt検定 対応のあるt検定 (ピアソンの積率)
相関係数
ノンパラメトリック法 ウィルコクソン検定 ウィルコクソンの符号つき順位検定 スピアマンの
順位相関係数
 

 上表の通り、対応のないデータを用いた2つの母平均の差の検定に相当するノンパラメトリック検定がウィルコクソン検定です。検定の手順はパラメトリック検定のときと同様で、帰無仮説、対立仮説を設定し、検定統計量を計算し、求めた検定統計量が、あらかじめ設定した有意水準αから定める棄却域に入るか入らないかで有意かどうか判定します。
 検定の手順は同様と述べましたが、いくつかノンパラメトリックの特徴を生かして検定を進める必要があります。まず、パラメトリック検定と違いがあるのは仮説の設定です。パラメトリック検定では2つの母平均が等しいと帰無仮説を立てますが、ノンパラメトリック検定では順位データを用いて推測するので、「2つの母集団の分布の中心位置は等しい」と帰無仮説を立てます。次に、検定統計量の統計量に順位データを用いることです。2つの母集団のデータを統合し、小さい方から順位をつけ、データ数の少ない母集団の方の順位和を求めます。この統計量を正規近似し、基準化することで検討統計量を求めることができます。有意かどうかの判定は正規近似を行っているので、両側検定の場合は有意水準5%で棄却域は絶対値で1.96以上となります。データ数が小さい場合は直接確率を求め検定します。

 また、対応のある場合は対のデータの差を符号付きで求め、正の集団と負の集団に分け、データ数の少ない方の順位和を計算します。この順位和の統計量を同様に、正規近似し検定統計量を求め検定します。データ数の少ない場合は直接確率を求め検定します。
 その他、ノンパラメトリック法における相関分析として、スピアマンの順位相関係数というものがありますが、これは各母集団それぞれ順位データに置き換え、順位の対のデータをパラメトリック法にける相関係数の求め方と同じ方法で算出します。 
 簡単に代表的なノンパラメトリック法を紹介しましたが、どれも順位データに置き換え、その統計量が正規分布に従っていると仮定し推測しています。ですので、パラメトリック法とさほど大きな違いはありません。ノンパラメトリック法は分布を仮定しない方法ですので、難しい方法と思われがちですが、ざっくりと有意か有意でないか把握したい場合に便利に用いることができます。さらに、そこまで情報量を損失しないので、ある程度のデータがあれば適用可能です。現場でぜひ適用してみてください。これまで敬遠しがちだったかもしれませんが、機会があればぜひ一度使ってみてはいかがでしょうか。

関連セミナー
 
戻る
Profile

      隄 雄亮 氏
    (つつみ ゆうすけ)

2006年 田辺製薬㈱(現田辺三菱製薬㈱)入社後 医薬品開発データの解析に携わり,在職中に2012年 博士(工学)取得。
現在は㈱三菱ケミカルホールディングス経営戦略室 課長

関連記事
 
〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2021 Union of Japanese Scientists and Engineers. All rights Reserved.