
SQC
重回帰分析と主成分分析<2019年09月30日>

重回帰分析と主成分回帰分析
SQCには様々な手法が存在しますが,実践の場で実際に使われる統計的手法の中での最も使われる一つが重回帰分析です.普段から採っているデータにも使え,調査で採ったデータにも使え,そして実験計画法で採ったデータにも使えます.しかも,説明変数に量的変数と質的変数が混在していても扱えるので,広範囲に応用することができます.すなわち,因果関係がどうなっているのか,知りたい予測値はいくらか,何に手を打ったらよいのかなどが客観的に行えるわけです.
しかしながら,重回帰分析には説明変数間に高い相関が存在すると解析は混乱するというアキレス腱があります.これを解決するために「主成分回帰分析」というものが登場しました.主成分は互いに独立なので,相関の問題を解決することができます.しかしながら,主成分で重回帰分析を行った場合には,重回帰式の解釈はできますが,手を打つことが困難です.何故ならば,主成分は多数の説明変数を合成(線形結合)した変数のために抽象的なものだからです.抽象的なものは頭で解釈をすることはできますが,それに具体的な手を打つことが難しいわけです.対策は具体的な説明変数に対して打つのが望ましいので,次のように考えてアプローチすると上手く行きます.
主成分はカプセル(その中に全変数を内包した容器)であると考えることができます.k個の変数からk個の主成分が求められるのですが,どの主成分にもk個の変数がすべて存在しています.主成分の中での関係(似たものは近くに集まる)がどうなっているのかは,因子負荷量図を見ると明らかになります.したがって,主成分回帰分析で変数選択された主成分に関して因子負荷量図を作ります.因子負荷量は主成分と変数との相関係数なので,その絶対値の大きなものが主成分との関係が強いことを意味します.それ故に,主成分回帰分析で選択された主成分に対して因子負荷量の絶対値の大きなものに注目すればよいわけです.
実は,説明変数の間の相関が高い場合の重回帰分析には以下の問題があるのです.
(A)互いに相関の高い変数の間では,どれかの変数が選ばれると
他が選ばれなくなる.
※相関が高いということは持っている情報が似ているので,
一つを選ぶと他は役に立たなくなるので選択されないという場合です.
(B)互いに相関がそこそこ高い変数の間では,複数のものが選ばれるので
偏回帰係数が混乱する.
※目的変数yを説明する場合に上手く説明しようとして
変数間で互いにやりくりをします.
ある係数が大きいと他の係数を減らしたり,
時には符号を逆にしたりというようなやりくりをするわけです.
つまり偏回帰係数の符号や値が信じられないために,
手を打つべき重要な変数を見定めることが難しい状況になります.
[注]厳密には標準偏回帰係数の絶対値の大きさで影響力を判断するのですが,これも相関の影響を受けます.
このとき,主成分回帰分析は主成分を対象に重回帰分析をしますので,すべての変数が主成分の中に入っているので(A)の問題を回避することができます.そして,目的変数yの説明に関しては,重要な主成分の中の因子負荷量の絶対値の大きなものに注目をすれば(B)の問題も回避することができます.
多岐に渡る手法
ところで,近年のアンケートは質問項目がたいへん多いということが特徴です.ITの環境が進化した結果として,アンケートを簡単に電子的に採ることが可能になったからです.すると,すべての変数を一塊にして全部の変数に関する主成分をとることが微妙になってきました.例えば,ビジネスホテルの満足度を例にとると,質問項目は①接客(フロントのスタッフの対応[客と接触])と②客室(客室内の状況・雰囲気や各種のハードウエア類[客と非接触])と③朝食(食堂内の状況・雰囲気と食材の品数・味[セルフサービスなので基本的には客と非接触])の3群になります.群内は相関が高く,群間は相関が低いという特徴を持ちます.このような場合には,全質問項目で主成分をとるのではなく,群ごとに主成分をとって重回帰分析をすればよいのです.この方法を私は「多群主成分回帰分析」と呼んでいます.
実は,近年注目されている方法に「SEM(Structural Equation Modeling:構造方程式モデリング)」があります.これは互いに相関の強い多数の変数がある場合にたいへんパワフルな方法なのです.私は大学院生に対してはこれを講義しています.しかし,これは方法として難しいことと,これを用いて会議で説明しようとすると多くの人は理解が難しいという反応を示します.しかし,因果連鎖(Aが原因でBが起きるが,そのBが原因でCが起きるという因果構造)がある場合には,SEMを使うことは不可欠です.けれども,多くの問題の場合には原因の数は多くても,因果連鎖を無視してもあまり問題がありません.そのような問題もSEMで扱うことはできるのですが,それは「鶏を割くに焉んぞ牛刀を用いん」(やり過ぎ)と言うことになります.つまり,因果分析では,因果連鎖があるかどうかで分類することが重要です.そこで,以下に両者の簡単な典型例を2つずつ示します.
*ビジネステルに一泊する場合に因果連鎖はありません.
*コンビニエンスストアで買い物をする場合に因果連鎖はありません.
しかし,
*長期間の教育や訓練の場合には因果連鎖が避けられません.
*病院における長期入院の場合には因果連鎖が避けられません.
前者には多群主成分回帰分析が向いており,後者にはSEMが向いています.このようにして,対象によって使い分けることが重要です.
実務に活かせる「分析」
今回紹介しましたのは,これからの重回帰の応用としては多群主成分回帰分析が有効であるということです.重回帰分析も主成分分析も近年の統計ソフトのほとんどに入っていますので簡単に行うことができます.一方,重回帰分析・主成分分析を学んだ皆さんは,SEMにも注目をして下さい.これを用いれば,複雑高度な因果関係を把握することができます.近年ではStatWorksを始めとして,高度な統計ソフトにはSEMが用意されています.
重回帰分析・主成分分析を学んだ皆さんでしたら多群主成分回帰分析は直ぐに理解できます.そしてSEMに比べるととても簡単なので直ぐに使うことができますので,是非とも一度試してみて下さい.
最後になりましたが,先頃,多群主成分回帰分析の使い方に関して詳しく解説をしている「アンケートによる調査と仮想実験~顧客満足度の把握と向上~」という本を,日科技連出版社から出版しました.ご関心のある方は一度見ていただけたら幸いです.
【タイトルの図の解説】
会議などで出席者の人々から合意を得るには可視化した簡潔な資料で分かり易く説明することが重要です.「ビジネスホテルの顧客満足度の構造模型図」は,これ1枚で全体の状況を以下のように簡潔に説明することができるものです.
総合満足度を把握するために3つの評価を聞きましたが,それらは本質的には充実感に要約することができます.充実感にしっかりと関係するものとして,11個の質問項目と充実感との相関を調べたところ,備品とリネンは相関が低く,これらは現時点では充実感への影響はないので除外します.他のものはいずれも充実感への影響がありますので,これらと充実感の関係を把握する必要があります.
しかし,項目間の相関が高いので,先ずは3つの群ごとに主成分を求め,それぞれの意味解釈を行います.その上で,充実感と主成分の重回帰分析(変数増減法による変数選択)行ったら4つの主成分が選択されました.これらの主成分の中身を因子負荷量図で見ますと,重要な項目(重要な主成分に相関の高い項目)は★印のついた3つの項目であることが分かりました.したがいまして,結論としては顧客満足度の向上のためには,「フロントスタッフの接客向上」と「寝心地向上のための寝具のレベルアップ」と「朝食の味の向上」を図る必要があるということです.



高橋 武則(たかはし たけのり)
慶應義塾大学客員教授
1980年 早稲田大学大学院理工学研究科博士課程修了(工学博士),東京理科大学助教授,同教授,慶應義塾大学教授,目白大学教授を経て2017年から現職.
『Statistical Methods for Quality Improvement』(共著,AOTS),『統計的推測の基礎』(文化出版局),『統計モデルとQC的問題解決法』(日本規格協会),『統計的方法と管理・改善』(品質月間委員会),『模擬生産・模擬実験と統計的品質管理』(品質月間委員会),『マネジマント・サイエンス』(共著,培風館),『統計モデルによるロバストパラメータ設計』(共著,日科技連出版社)など品質経営や統計的方法に関する書籍を多数執筆.2016年までデミング賞委員会副委員長,現在SAS Discovery Summit Japan委員会委員 など.


〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2021 Union of Japanese Scientists and Engineers. All rights Reserved.