よくある質問

統計的品質管理

Q.

観察データや記録によるデータから有益な情報を導き出したいと考えています。データ相互の因果関係を分析できる手法はありますか?

A.

観察データや記録によるデータから、その因果関係を探索する分析手法として、グラフィカルモデリング(GM)があります。

要因から特性への因果関係を把握するためには実験(特に実験計画法)が王道です。しかし、実験が困難な場合、あるいは実験の前段階の検討を行いたい という理由から、調査データや工程で得られたデータなどの「観察データ」を用いて因果関係を検討したい場合もあると思います。そんなときがGMの出番で す。

GMでは、得られたデータに基づいて、変数間の「条件付き独立性」の分析を行います。これは、ある2変数X,Yが、他の変数Zを一定とした場合に (そういう条件の下で)「独立である(=無相関)か・独立でない(=相関がある)か」を調べるということです。その結果は、条件付き独立でない(=他の変 数を一定としても相関がある)変数を線で結んだ「独立グラフ」としてグラフィカルに表します。間に線がある変数間には、直接的な(=他の変数によらない) 因果関係がある可能性があります。こうした知見は、次のステップとして、SEM(構造方程式モデリング、共分散構造分析)、パス解析、回帰分析などによる 定量的な因果モデルの構築、あるいは実験の計画に役立ちます。

(早稲田大学 人間科学学術院  人間科学部 准教授 小島 隆矢)

Q.

構造方程式モデリングを実践すると、観察データの因果関係を定量的に評価・解釈できると聞きました。構造方程式モデリングとは何ですか?

A.

「構造方程式モデリング」(「共分散構造分析」とも呼ばれます。以下,SEM)は、多変量解析手法の1つであり、観察データに基づいて変数間の因果関係を定量的に評価・解釈できることが特徴です。

SEMは、調査データの分析では既に広く活用されています。
これは、分析モデルに人の意識など直接観測できないものも「潜在変数」として取り込むことができ、更に、潜在変数間の因果関係も分析できるという点が大きいと思われます。

一方、工程データの分析では、SEMはまだ十分に活用されているとは言えません。
これは、工程データにおける潜在変数の有用性や、そもそも現象をモデル化することの必要性が必ずしも認識されていなかったという面があると考えられます。

しかし、工程の改善を更に進めるためには、変数間の因果関係をしっかりと把握することが必要であり、SEMはそのための有用な統計手法の1つである、との認識が製造業でも広まりつつあります。実際、製造業の大手企業では具体的にSEM活用の検討が進められています。

このように、様々な分野での活用が今後ますます進むであろうSEMですが、他の統計手法と同様に、活用するためには幾つかの知識が必要となります。

Q.

あるデータの因果関係を把握したいと考えております。実験計画法ではなく観察によって得られたデータでは、因果関係の把握は難しいでしょうか?

A.

実験計画法では、原因系の因子を変化させて実験を行い、その実験結果(特性値の変化)が、誤差を超えた違いかどうかを検定することによって、因子の効果を判断します。

因子がAとB2つある場合を考えます。実験計画法では、因子AとBならびにA×Bの組合せによる(交互作用)効果と誤差の効果を分離できる様にデータを採取します。これに対して、調査データ等の観察によって得られたデータの場合、あらかじめ実験を計画してデータを採取したわけではないため、因子A×Bの交互作用効果と誤差の効果とが入り混じって(交絡して)分離できないケースが考えられます。この様なケースでは、GM(グラフィカルモデリング)が有効です。

GMでは、様々な因子間(変数間)の関係をグラフによりモデル化します。そこから得られる知見は、次のステップとして、SEM(構造方程式モデリング、共分散構造分析)、パス解析、回帰分析などによる定量的な因果モデルの構築、あるいは実験の計画に役立ちます。すなわち、実験計画法の前段階に用いるのがより相応しいと言うことができます。 

Q.

統計解析ソフトを用いて重回帰分析を行おうとしたところ、「多重共線性あり」とのメッセージが表示されました。「多重共線性」とは何ですか?

A.

重回帰分析において、説明変数間の相関が極端に高いことを多重共線性といいます。多重共線性が起きている場合には、以下の様な問題が生じます。

・技術的にみて解釈が困難な結果(正負の符号が逆、絶対値が常識を越えて大きい等)が生じる。
・観測値のわずかな変化(一部の観測値の除去、一部の説明変数の追加)によって、回帰係数の推定値が大きく変化する。

多重共線性を解決する方法としては、以下の様なものがあります。

1)説明変数の一部を除去する。
2)説明変数の要約(相関の強い2変数の平均をとる)を行う。
3)変数の本質的要因を探り、これを説明変数とする
4)似ている説明変数をまとめて多重共線性を避けるようにする。

上記3)4)の解決法を実行するには、「構造方程式モデリング」(「共分散構造分析」とも呼ばれます。以下、SEM)が有効です。SEMは、多変量解析手法の1つであり、3)でいうところの本質的要因を「潜在変数」として取り込むことができ、かつ「パス図」と呼ばれる図によって変数間の因果関係をしっかりと把握することが可能となります。 

▲TOP
一般財団法人 日本科学技術連盟
Copyright© 2023 Union of Japanese Scientists and Engineers. All Rights Reserved.