第9回
2011年 1月号
|
確率パズルにだまされるな!(その2)〜産み分けのジレンマ?〜
ベイズ推定による確信度の分布の変化を把握する
|
|
|
操作方法・メニュー画面で、どのケースのベイズ推定を行うかを選択します。「バラバラなコイン」についてはnの値を選びその数字のボタンをクリックします。・各ケースは、コイン(もしくは物体X)を投げる試行の次回の表/裏を、画面下方にあるボタンで順次指定していくことで進行します。・表/裏を指定する毎に(すなわち、1回の試行結果が与えられる毎に)、前回までの結果が反映された確信度の分布(=前回の事後分布)を事前分布とみなし、今回の結果をさらに反映するためのベイズ更新が実施されて、その結果の事後分布が赤で表示されます。(比較のため、事前分布もグレーで表示されます。)・コイン投げの試行結果は20回まで指定できます。(終了する際は「メニューへ」をクリック)各ケースの説明バラバラなコインこのケースでは、各コインの「投げて表が出る確率」は明らかになっており、それらのコインの中から無作為に1個を選ぶという設定なので、コインの選択から含めて一連の試行とみなせば、ベイズ推定の手法で確率分布を更新していても、そこで扱っているのは主観確率ではなく客観確率だと言えるでしょう。この場合、ベイズの定理を用いた確率分布の更新(ベイズ更新)は、定義に基づいた条件付き確率の計算を定式化したものにすぎません。 離散的確率変数θの事前分布をf(θ)、θを固定した時の事象Aの起きる確率をPθ(A)とすると、事象Aが起きたという情報を反映させた事後分布は なお、Flashでは、事後分布におけるθの平均値θの値が表示されますが、その時点までの試行結果を踏まえた「次に表の出る確率」を問われた場合は、そのθを答えればよいことになります。もちろん、「そのコインが、『投げて表が出る確率』がいくらのコインであるかを当てたら賞品がもらえる」というシチュエーションの場合は、事後分布の棒グラフが一番高いところのθを答えるのが最も有利です。各コインに属するパラメータとしてのθと、現在の状況を踏まえた条件付き確率であるθを混同しないようにしましょう。 あいまいなコインこのケースでは、θについての情報がない状態を「確信度が[0,1]の範囲に一様に分布する」とモデル化することから議論が始まっている以上、ここで扱われているのは主観確率です。このケースは雑誌本編の問題3に相当するので、詳細は本編を参照して下さい。本編では、4回投げて「表表裏表」の順となったケースのみを扱いましたが、試行結果をいろいろ変えてみた場合に事後分布がどのように変化するかを観察してみましょう。 なおこのケースで、a+b回投げて、表がa回、裏がb回出た場合の事後分布は、順序にかかわらずベータ分布Be(a+1,b+1)となり、 |