意思決定理論のにおける有名な問題の一つに、サンクトペテルブルグのパラドックスがあります。
数学者のダニエル・ベルヌーイがサンクトペテルブルグ科学アカデミーに滞在しているときに発案したので、このように呼ばれます。
ブルーバックスの「意思決定の科学」に分かりやすく解説されているので引用。
偏りのない公平なコインを一つ、表が出るまで投げ続けるゲームを考えます。このとき、k回目に初めて表が出たら2のk乗 (単位は百円)の賞金がもらえるとします。
ここで、あなたはこのゲームに1回だけ参加する権利を無償で手に入れましたが、これを他の人に売ることにしました。
さて、あなたなら、最低いくらでこのゲームに参加権を売りますか?
賞金の期待値を計算してみるのが定石でしょう。
1回目で表が出るとき:確率は1/2、賞金は200円。
2回目で表が出るとき:確率は1/4、賞金は400円。
3回目で表が出るとき:確率は1/8、賞金は800円。
以降、4回目、5回目・・・と続きます。
期待値は全てのケースの確率x賞金の和をとった値なので、
1/2×200 + 1/4×400+1/8×800+・・・=∞
よって賞金の期待値は無限大。
つまり、このゲームの参加権の価値は無限大。
だったら他の人から1億円積まれても売らない。
え・・・本当に???
私がこのゲームのルールを読んだとき、参加権は500円くらいなら売るかな?と直感的に考えました。でも実際の賞金の期待値は無限大。
つまり、数学的な賞金の期待値と私の直観が告げる「賞金の見込み額」には乖離が存在するということ。
これがパラドクス (受け入れがたい結論をえること)なんです。
このパラドクスを解消するためにベルヌーイは何をしたか?彼が導入したのが「効用」の考え方です。効用は「マートンのポートフォリオ問題」の記事で紹介しました。再掲すると:
効用とは、個人が受け取った利益 (損失)に対する主観的な満足 (不満足)の程度。
ベルヌーイは、人はゲームの賞金を見込むときに、「賞金の期待値」ではなくて賞金を得たときの「効用の期待値 (期待効用)」を考えていると想定すれば、パラドックスを解消できると提唱したのです。
じゃあ効用はどうやって計算するのかというと、効用関数を使います。
上述のように効用は「主観的」なものなので、関数の形状は人によって異なります。一般的によく使われる効用関数は賞金の平方根で表せます。(※)
というわけで、上のゲームで賞金の期待効用を計算してみると、
1/2x√200 + 1/4x√400 + 1/8x√800 +・・・=24.14
これを金額に換算すると、24.14×24.14=583
よって583円がこのゲームの賞金を期待効用から見込んだ金額。私は500円くらいかな?と考えたので、当たらずとも遠からずです。
注意すべきは効用関数は人によって異なるということ。上に挙げた賞金の平方根はあくまで効用関数の一つの例です。
そこで効用関数にあるパラメータを導入して、それを変化させることで効用関数の形状を操作すれば、人によって異なる効用関数をつくることができます。
そのパラメータこそ相対的リスク回避度 (RRA)です。相対的リスク回避度は「自分のリスク許容度を知るための相対的リスク回避度の計算方法」の記事で紹介しました。
ところで、過去記事では相対的リスク回避度を下のグラフから読み取って計算するという話でしたが、そもそもこのグラフどうやって書いたの?って思ってました。
このグラフは効用関数を用いて書くことができるんです。
効用関数と相対的リスク回避度の関係は次の記事で紹介します。
※一般的に人は賞金の金額が小さいほど、賞金を少し増やしたときの満足度の増加は大きいです。一方で賞金が大きいほど、賞金を少し増やしたときの満足度の増加は小さい。例えば100円の賞金に対して110円に上がれば満足度は大きく増え、100万円の賞金に対して100万10円にあがっても満足度は大して増えません。これを限界効用逓減とよび、効用の逓減を数学的に簡単に表現できるのが平方根です。
参考:
私のとってイメージしにくかった「効用」を易しく解説してくれる名著。
「意思決定」の科学 なぜ、それを選ぶのか【電子書籍】[ 川越敏司 ]
Twitterでブログ記事の更新通知を受け取れます:
記事が役に立ったらクリックお願いします↓
このゲームにいつもの「平均値・中央値」議論を適用すると,このゲームのリターンの中央値は200円ですから,「200円より大きい金額であれば参加権を売る人がいる」という展開になりそうです.そして,「201円で参加権を買い集めた人が億万長者になり格差が広がりました」というところまでが”お話”でしょうか.(「1回だけ参加する権利」を買い集めた人は「何回でも参加できる」というルールが必要ですが)