
回帰分析の試用と使用<2017年10月27日>

1、回帰分析はよく利用される手法だが注意が必要である。
回帰分析は統計的手法の中で最もよく用いられるものの一つである。
これは主に以下の目的で用いられる。
*予測(知りたい値の把握)、*制御(望む値の実現)
予測を目的に使用する場合には悩むことなく積極的に回帰を用いることができる。
しかし、制御を目的に使用する場合には十分な注意が必要である。結論を先に言えば、
制御に用いる場合は実験計画で取ったデータに基づいて作成した回帰式を用いるのが
安全である。
回帰分析において使用するデータは2種類に分類できる。一つは調査データ(管理せ
ずにとったデータ)で、もう一つは実験データ(管理して取ったデータ)である。
調査データの処理の場合はデータの層別、調査の前提条件、調査時期、変数間の相関
などに十分気を付けなければならない。そうしないと、誤った結果を得る危険や結果
の解釈を誤る危険がある。これらの詳細については紙数の関係で紹介できないため関
連する書籍を参考にされたい。
一方、実験データは管理して取ったデータなので安心して回帰分析を用いることがで
きる。管理してデータを取るということはコストと時間がかかるが、回帰分析を通し
て確実な情報を獲得することができ、その上、回帰式を用いて予測はもちろんのこと
制御ができるために大きなメリットがある。しかしながら、次に述べる注意点を忘れ
てはならない。
2、回帰式は取り上げた区間の中での近似式でしかない。
管理して取ったデータに基づいて回帰式(数式)が得られると、それは客観的な真の
因果関係(本質的な式)を示していると誤解する人が少なくない。それは間違いで、
回帰式は取り上げた区間の中での近似式でしかないのである。したがって、区間が
変われば式は全く別のものになる。また、区間の外に対しても式を適用すること
(外挿と呼ぶ)は危険である。あくまでも区間の中で式を適用すること(内挿と呼ぶ)
が原則で、しかもそれは近似式であることを忘れてはならない。
さらに、内挿でも時にはうまく行かないことがあることに注意が必要である。
何故ならば、回帰式は実験点(意図的に実施した条件)での値や観測点(たまたま
遭遇した条件)での値だけをうまく説明するための便宜的な式なので、実験点と
実験点の間や観測点と観測点の間の値に関しては何も保証してくれない。例えば、
2次の関数に対して2水準の実験データからは1次式(直線)しか近似できない。
取ったデータの2点(実測点)はうまく説明できるが、2次の関数をとらえること
はできない。ただし、水準間があまり広くなければ実験点間は概ね線形であるこ
とが多いので心配はない。もし不安であるならば3水準ないし4水準の実験をする
ことが望ましい。そうすれば非線形性が吟味でき、必要ならば2次式で近似するこ
ともできるからである。
もう一つの注意は積項(交互作用)である。多数の因子を取り上げて因子の水準
幅を広くとった場合には、幾つかの因子の間には積項(交互作用)が存在する可
能性がある。これを無視して単純な1次式を用いると、不適合な近似式となるため
に解析も設計も失敗してしまう。積項(交互作用)がありそうな場合には、それ
を扱うことができる実験計画のもとでデータを取る必要がある。良いデータを得る
には手間とコストが不可欠なのである。
3、回帰式の適用限界と更新に注意しなければならない。
あるとき某工場で作成した回帰式がとても有効であったとする。その事実は確か
でも、それが同じ会社の他の工場や他社でも適用できるとは限らない。むしろ、
ある条件(前提条件)の下での近似式なので、他の工場や他社では前提条件の
相違からそのままでは使えない場合が多い。つまり回帰の利用は適用限界
(式が得られた背景)に注意が必要なのである。
当該の工場においてはしばらくの間は有効に機能するであろう。しかし、それ
がいつまでも有効とは限らない。時間が経過すれば工場自体の条件の変化
(改善、改築、設備更新ほか)や工場を取り巻く条件(環境、原材料・部品、
納入業者の状況ほか)が変化して機能しなくなる。したがって、回帰式の更新
が必要になる。適切なタイミングで更新の必要性の有無を確認し、必要となった
場合には更新しなければならない。
4、先ずは易しい実例に試用してその後に実際問題に使用する。
以上いくつかの注意すべき点を述べたが、これらに注意を払いさえすれば回帰分析
は極めて有用なツールである。しかし、使ってみないことにはその良さが分からない。
まずは易しい実例に対して使ってみる(試用する)と良い。
予測の身近な実例として「マンションの賃貸料の予測」がある。マンションの諸条件
(広さ、建築後の経過年数、最寄駅までの距離ほか)が分かれば賃貸料をかなりの精度
予測することができる。ただし、AエリアとBエリアでは異なるし、同じエリアでも
時代が変わると異なる。したがって回帰式の適用限界と更新は不可欠なのである。
複数のエリアでの予測や同一エリアに関して数年の間隔を置いた予測を比較するとこ
のことが実に良く分かる。
制御の身近な実例は難しい。自分で制御してデータを発生させなければならないから
である。そこで、簡単な実験として「紙ヘリコプターの滞空時間の制御」を紹介する。
図1①に示すように紙を切り、上の部分の真ん中を切ったうえで互い違いの方向に折れ
ば図1②の様にローマ字の大文字のT字形になる。下の部分にクリップを付けて空中に
離すと飛行(正確には回転降下)する。この飛行時間を翼長さで制御することができ
る。数段階の翼長の紙ヘリコプターを作って飛ばせば図2の様に回帰式が得られる。
その式を用いれば望む時間を飛行する機体の翼さの長さが分かるので、それを実際に
作って飛ばして確認すると良い。何機も作成してそれらがほぼ望む時間で飛行した
ときは軽い感動を体験することができる。
以上のような身近な例はいずれも手軽にできるので、是非一度試されたい。そして、
身近な例で回帰分析の有用さを経験したならば、実際の問題に適用すると良い。
何事も始めなければ始まらない。
5、回帰分析のソフトは玉石混交である。
ほとんどの統計ソフトは回帰分析を用意しているが、そのレベルは玉石混交で
ある。単に最小二乗法で推定式を求める程度のことしかやってくれないソフトは
不便でありかつ回帰分析の誤用を招く危険がある。例えば、安易に外挿(データ
を取った範囲の外で用いるという危険を孕む推定)を受け付ける(警告もなしに
計算して結果を示す)とか、ただの寄与率(得られた式の過大評価)だけしか表
示せず、自由度調整済み寄与率(得られた式の厳しめの評価)や自由度調二重整
済み寄与率(得られた式のかなり厳しい評価)を表示しないソフトは薦められな
い。便利にそして安全に回帰分析を活用するにはStatWorksなどのきちんとした
統計ソフトを利用することが望ましい。
6、回帰分析を試用して使用されたい。
知識獲得(分かること)と実力獲得(出来ること)は同じではない。まさに
「習うより慣れよ」で、失敗を恐れずに実際に使ってみることが肝要である。
先ずは身近な易しい実例で試用してどのようなものなのかを実感し、次に実際の
事例に使用することをお薦めする。



高橋 武則 氏
(たかはし たけのり)
慶應義塾大学客員教授
1980年 早稲田大学大学院理工学研究科博士課程修了(工学博士)、東京理科大学助教授、同教授、慶應義塾大学教授、目白大学教授を経て2017年から現職。
『Statistical Methods for Quality Improvement』(共著、AOTS)、『統計的推測の基礎』(文化出版局)、『統計モデルとQC的問題解決法』(日本規格協会)、『統計的方法と管理・改善』(品質月間委員会)、『模擬生産・模擬実験と統計的品質管理』(品質月間委員会)、『マネジマント・サイエンス』(共著、培風館)、『統計モデルによるロバストパラメータ設計』(共著、日科技連出版社)など品質経営や統計的方法に関する書籍を多数執筆。2016年までデミング賞委員会副委員長、現在SAS Discovery Summit Japan委員会委員 など。

