Mail News Archives
 検索
   
SQC(統計とビッグデータ)
SQC

ベイズ統計学<2016年03月10日>


コインを n = 10回投げたら x =2回だけ表が出ました。
表の出る確率 p を推定してください。
通常の統計学では、x / n = 2/10 = 0.2と答えます。
しかし、p が0.2であることを素直に受け入れられるでしょうか。

基本的に表と裏の出る確率は等しく、少し偏りがあるかもしれないという事でデータを取る前は”0.5ぐらい”と考え、データを考慮すると、0.5よりは小さいかなと考えるのはいかがでしょうか。
ベイズ統計学では、”0.5ぐらい”というようなコインに関する先験的情報をデータに組み入れて、pを推定します。

“0.5ぐらい”という情報は、“ぐらい”といったところまで含めて確率分布で表現します。この確率分布のことをデータが得られる前の先験的情報という意味で、事前分布と呼びます。p は 0 < p < 1 の連続値を取りますから、p = 0.5 を中心(モード)とするパラメータ( 0.5 , 0.5 ) のベータ分布が適してます。

データは二項分布に従いますので、事前分布のベータ分布とデータの二項分布から「ベイズの定理」を用いて、p の事後分布を求めます。
事後分布がベイズ統計学のアウトプットです。

p を確率変数として扱うのに抵抗があるかもしれませんが、pの真値が確率的に動いているのではなく、解析者の p に関する不確かさを表現しているのだと考えてください。

そして、p の事後分布とは、先験的情報にデータの情報を組み込んだ後のpに関する不確かさの様子です。
つまり、ベイズ統計学は、解析者の先験的情報をデータで更新し、母集団を推測するスタイルの統計学です。事後分布の期待値を p の点推定量とすると、点推定値は約0.35になり、データと先験的情報の間を取ります。

通常の統計学が白紙から推測するスタイルであるのに対し、ベイズ統計学は過去の知識から推測するスタイルであると思います。企業内には今までの経験が蓄積されていることと思います。その経験を事前分布でうまく表現できれば予測精度の向上、実験の効率化などにつながると思います。

どちらの状態からスタートするか、それは問題によって異なるのでどちらが良いか悪いかではないことにも注意してください。
 

関連セミナー
 
戻る
Profile

      安井 清一
    (やすい せいいち)

2006年東京理科大学理工学研究科経営工学専攻博士後期課程修了、博士(工学)取得後、東京理科大学理工学部経営工学科助手を経て、現在、助教。
主な専門分野は、統計的品質管理。

関連記事
 
〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2021 Union of Japanese Scientists and Engineers. All rights Reserved.