意思決定理論と不思議なサンクトペテルブルクのパラドックスを説明する。

意思決定理論のにおける有名な問題の一つに、サンクトペテルブルグのパラドックスがあります。

数学者のダニエル・ベルヌーイがサンクトペテルブルグ科学アカデミーに滞在しているときに発案したので、このように呼ばれます。

ブルーバックスの「意思決定の科学」に分かりやすく解説されているので引用。

偏りのない公平なコインを一つ、表が出るまで投げ続けるゲームを考えます。このとき、k回目に初めて表が出たら2のk乗 (単位は百円)の賞金がもらえるとします。

ここで、あなたはこのゲームに1回だけ参加する権利を無償で手に入れましたが、これを他の人に売ることにしました。

さて、あなたなら、最低いくらでこのゲームに参加権を売りますか？

賞金の期待値を計算してみるのが定石でしょう。

1回目で表が出るとき：確率は1/2、賞金は200円。

2回目で表が出るとき：確率は1/4、賞金は400円。

3回目で表が出るとき：確率は1/8、賞金は800円。

以降、4回目、5回目・・・と続きます。

期待値は全てのケースの確率x賞金の和をとった値なので、

1/2×200 + 1/4×400+1/8×800+・・・=∞

よって賞金の期待値は無限大。

つまり、このゲームの参加権の価値は無限大。

だったら他の人から1億円積まれても売らない。

え・・・本当に？？？

Sponsored Link

私がこのゲームのルールを読んだとき、参加権は500円くらいなら売るかな？と直感的に考えました。でも実際の賞金の期待値は無限大。

つまり、数学的な賞金の期待値と私の直観が告げる「賞金の見込み額」には乖離が存在するということ。

これがパラドクス (受け入れがたい結論をえること)なんです。

このパラドクスを解消するためにベルヌーイは何をしたか？彼が導入したのが「効用」の考え方です。効用は「マートンのポートフォリオ問題」の記事で紹介しました。再掲すると：

効用とは、個人が受け取った利益 (損失)に対する主観的な満足 (不満足)の程度。

ベルヌーイは、人はゲームの賞金を見込むときに、「賞金の期待値」ではなくて賞金を得たときの「効用の期待値 (期待効用)」を考えていると想定すれば、パラドックスを解消できると提唱したのです。

じゃあ効用はどうやって計算するのかというと、効用関数を使います。

上述のように効用は「主観的」なものなので、関数の形状は人によって異なります。一般的によく使われる効用関数は賞金の平方根で表せます。(※)

というわけで、上のゲームで賞金の期待効用を計算してみると、

1/2x√200 + 1/4x√400 + 1/8x√800 +・・・=24.14

これを金額に換算すると、24.14×24.14=583

よって583円がこのゲームの賞金を期待効用から見込んだ金額。私は500円くらいかな？と考えたので、当たらずとも遠からずです。

注意すべきは効用関数は人によって異なるということ。上に挙げた賞金の平方根はあくまで効用関数の一つの例です。

そこで効用関数にあるパラメータを導入して、それを変化させることで効用関数の形状を操作すれば、人によって異なる効用関数をつくることができます。

そのパラメータこそ相対的リスク回避度 (RRA)です。相対的リスク回避度は「自分のリスク許容度を知るための相対的リスク回避度の計算方法」の記事で紹介しました。

ところで、過去記事では相対的リスク回避度を下のグラフから読み取って計算するという話でしたが、そもそもこのグラフどうやって書いたの？って思ってました。

このグラフは効用関数を用いて書くことができるんです。

効用関数と相対的リスク回避度の関係は次の記事で紹介します。

※一般的に人は賞金の金額が小さいほど、賞金を少し増やしたときの満足度の増加は大きいです。一方で賞金が大きいほど、賞金を少し増やしたときの満足度の増加は小さい。例えば100円の賞金に対して110円に上がれば満足度は大きく増え、100万円の賞金に対して100万10円にあがっても満足度は大して増えません。これを限界効用逓減とよび、効用の逓減を数学的に簡単に表現できるのが平方根です。

参考：

私のとってイメージしにくかった「効用」を易しく解説してくれる名著。