月刊「理系への数学」数学パズルにトドメをさす?! 今月のFlash
第9回
2011年 1月号
確率パズルにだまされるな!(その2)〜産み分けのジレンマ?〜
ベイズ推定による確信度の分布の変化を把握する

目的

コイン投げを例に、試行結果に応じた確信度の分布の変化を観察することで、ベイズ推定の考え方に触れてみましょう。

バラバラなコイン

コイン毎に表が出る確率は判明しているがその値がバラバラであるようなコイン群のうちから1個を無作為に選んだという、表が出る確率についての確信度が離散的な分布になる状況から、試行結果を用いたベイズ推定を行います。

あいまいなコイン

コインらしき謎の物体Xの「表が出る確率」についての確信度の初期分布を一様分布と見なした上で、試行結果を用いて連続的な事前分布からのベイズ推定を行います。

操作方法

・メニュー画面で、どのケースのベイズ推定を行うかを選択します。「バラバラなコイン」についてはnの値を選びその数字のボタンをクリックします。

・各ケースは、コイン(もしくは物体X)を投げる試行の次回の表/裏を、画面下方にあるボタンで順次指定していくことで進行します。

・表/裏を指定する毎に(すなわち、1回の試行結果が与えられる毎に)、前回までの結果が反映された確信度の分布(=前回の事後分布)を事前分布とみなし、今回の結果をさらに反映するためのベイズ更新が実施されて、その結果の事後分布が赤で表示されます。(比較のため、事前分布もグレーで表示されます。)

・コイン投げの試行結果は20回まで指定できます。(終了する際は「メニューへ」をクリック)

各ケースの説明

バラバラなコイン

このケースでは、各コインの「投げて表が出る確率」は明らかになっており、それらのコインの中から無作為に1個を選ぶという設定なので、コインの選択から含めて一連の試行とみなせば、ベイズ推定の手法で確率分布を更新していても、そこで扱っているのは主観確率ではなく客観確率だと言えるでしょう。この場合、ベイズの定理を用いた確率分布の更新(ベイズ更新)は、定義に基づいた条件付き確率の計算を定式化したものにすぎません。

離散的確率変数θの事前分布をf(θ)、θを固定した時の事象Aの起きる確率をPθ(A)とすると、事象Aが起きたという情報を反映させた事後分布は
    fA(θ)=f(θ)・Pθ(A)/Σ{f(θ)・Pθ(A)}
と表されます(ベイズの定理)。ここでは、Pθ(表)=θ、Pθ(裏)=1-θであり、ベイズの定理の式の分母は確率の総和を1とするための正規化係数とみなすことができるので、事後分布の形状は事前分布に対して、表が出た場合は右上がりのθを、裏が出た場合は右下がりの1-θを乗じたものになることがわかります。(このあたりの事情は連続分布の「あいまいなコイン」の場合も同様です。)

なお、Flashでは、事後分布におけるθの平均値θの値が表示されますが、その時点までの試行結果を踏まえた「次に表の出る確率」を問われた場合は、そのθを答えればよいことになります。もちろん、「そのコインが、『投げて表が出る確率』がいくらのコインであるかを当てたら賞品がもらえる」というシチュエーションの場合は、事後分布の棒グラフが一番高いところのθを答えるのが最も有利です。各コインに属するパラメータとしてのθと、現在の状況を踏まえた条件付き確率であるθを混同しないようにしましょう。

あいまいなコイン

このケースでは、θについての情報がない状態を「確信度が[0,1]の範囲に一様に分布する」とモデル化することから議論が始まっている以上、ここで扱われているのは主観確率です。このケースは雑誌本編の問題3に相当するので、詳細は本編を参照して下さい。本編では、4回投げて「表表裏表」の順となったケースのみを扱いましたが、試行結果をいろいろ変えてみた場合に事後分布がどのように変化するかを観察してみましょう。

なおこのケースで、a+b回投げて、表がa回、裏がb回出た場合の事後分布は、順序にかかわらずベータ分布Be(a+1,b+1)となり、
    最頻値 θmode=a/(a+b)
    平均 θ=(a+1)/(a+b+2)
となります。このように、試行結果の情報を追加する毎にベイズ更新を行う場合、追加する情報の順序にかかわらず最終的な事後分布は同じになるという点にも着目してみて下さい。(バラバラなコインのケースでも同様です。)