資産運用

意思決定理論と不思議なサンクトペテルブルクのパラドックスを説明する。

投稿日:2021年8月18日 更新日:




 

意思決定理論のにおける有名な問題の一つに、サンクトペテルブルグのパラドックスがあります。

数学者のダニエル・ベルヌーイがサンクトペテルブルグ科学アカデミーに滞在しているときに発案したので、このように呼ばれます。

ブルーバックスの「意思決定の科学」に分かりやすく解説されているので引用。

偏りのない公平なコインを一つ、表が出るまで投げ続けるゲームを考えます。このとき、k回目に初めて表が出たら2のk乗 (単位は百円)の賞金がもらえるとします。

ここで、あなたはこのゲームに1回だけ参加する権利を無償で手に入れましたが、これを他の人に売ることにしました。

さて、あなたなら、最低いくらでこのゲームに参加権を売りますか?

賞金の期待値を計算してみるのが定石でしょう。

1回目で表が出るとき:確率は1/2、賞金は200円。

2回目で表が出るとき:確率は1/4、賞金は400円。

3回目で表が出るとき:確率は1/8、賞金は800円。

以降、4回目、5回目・・・と続きます。

期待値は全てのケースの確率x賞金の和をとった値なので、

1/2×200 + 1/4×400+1/8×800+・・・=∞

よって賞金の期待値は無限大

つまり、このゲームの参加権の価値は無限大。

だったら他の人から1億円積まれても売らない。

え・・・本当に???

 

Sponsored Link



 

私がこのゲームのルールを読んだとき、参加権は500円くらいなら売るかな?と直感的に考えました。でも実際の賞金の期待値は無限大。

つまり、数学的な賞金の期待値と私の直観が告げる「賞金の見込み額」には乖離が存在するということ。

これがパラドクス (受け入れがたい結論をえること)なんです。

このパラドクスを解消するためにベルヌーイは何をしたか?彼が導入したのが「効用」の考え方です。効用は「マートンのポートフォリオ問題」の記事で紹介しました。再掲すると:

効用とは、個人が受け取った利益 (損失)に対する主観的な満足 (不満足)の程度。

ベルヌーイは、人はゲームの賞金を見込むときに、「賞金の期待値」ではなくて賞金を得たときの「効用の期待値 (期待効用)」を考えていると想定すれば、パラドックスを解消できると提唱したのです。

じゃあ効用はどうやって計算するのかというと、効用関数を使います。

上述のように効用は「主観的」なものなので、関数の形状は人によって異なります。一般的によく使われる効用関数は賞金の平方根で表せます。(※)

 

というわけで、上のゲームで賞金の期待効用を計算してみると、

1/2x√200 + 1/4x√400 + 1/8x√800 +・・・=24.14

これを金額に換算すると、24.14×24.14=583

よって583円がこのゲームの賞金を期待効用から見込んだ金額。私は500円くらいかな?と考えたので、当たらずとも遠からずです。

注意すべきは効用関数は人によって異なるということ。上に挙げた賞金の平方根はあくまで効用関数の一つの例です。

そこで効用関数にあるパラメータを導入して、それを変化させることで効用関数の形状を操作すれば、人によって異なる効用関数をつくることができます。

そのパラメータこそ相対的リスク回避度 (RRA)です。相対的リスク回避度は「自分のリスク許容度を知るための相対的リスク回避度の計算方法」の記事で紹介しました。

ところで、過去記事では相対的リスク回避度を下のグラフから読み取って計算するという話でしたが、そもそもこのグラフどうやって書いたの?って思ってました。

このグラフは効用関数を用いて書くことができるんです。

効用関数と相対的リスク回避度の関係は次の記事で紹介します。

 

 

※一般的に人は賞金の金額が小さいほど、賞金を少し増やしたときの満足度の増加は大きいです。一方で賞金が大きいほど、賞金を少し増やしたときの満足度の増加は小さい。例えば100円の賞金に対して110円に上がれば満足度は大きく増え、100万円の賞金に対して100万10円にあがっても満足度は大して増えません。これを限界効用逓減とよび、効用の逓減を数学的に簡単に表現できるのが平方根です。

 

参考:

私のとってイメージしにくかった「効用」を易しく解説してくれる名著。

 

Twitterでブログ記事の更新通知を受け取れます:

 

記事が役に立ったらクリックお願いします↓

にほんブログ村 株ブログ 米国株へ

-資産運用

執筆者:


  1. アバター eeyore より:

    このゲームにいつもの「平均値・中央値」議論を適用すると,このゲームのリターンの中央値は200円ですから,「200円より大きい金額であれば参加権を売る人がいる」という展開になりそうです.そして,「201円で参加権を買い集めた人が億万長者になり格差が広がりました」というところまでが”お話”でしょうか.(「1回だけ参加する権利」を買い集めた人は「何回でも参加できる」というルールが必要ですが)

comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

S&P500長期リターンと幾何ブラウン運動モデルの比較

  過去記事からの引用。1950年1月以降のデータを使って1年リターン[%]を、1年・10年・20年・30年・40年の長期リターンを示したのは下のグラフです。 このデータをヒストグラムにして …

「ライフサイクル投資術」が名著だと考える理由は斬新さ。

  「ウォール街のランダムウォーカー」や「投資の大原則」は投資本のなかでも名著ですが、私は「ライフサイクル投資術」も名著に挙げたい。 その理由は「考え方が斬新」だからです。ウォール街のランダ …

レバレッジ3倍SPXLに投資するなら最大5年にするべきだと考える理由。ただし元本割れリスクは高い。

  米国S&P500の最適なレバレッジは1.75倍であることは前回の記事ですでに紹介しました。1.75倍以上のレバレッジをかけると時間とともにリターンの中央値が小さくなるためです。 …

WealthNaviはポートフォリオをどのように決めているのか?を説明する。

  過去に「WealthNaviのアルゴリズムを読むべし。現代ポートフォリオ理論に基づいてキッチリ分散。」という記事を書きました。 WealthNaviで運用することの是非はさておき、そのア …

S&P500に6000万円投資してFIREしたときの破産確率をシミュレーションした結果。

  前回の続き。 毎月の生活費が20万円の場合、資産6000万円をS&P500インデックスなどで運用しておけば、仕事やめても生きていける (FIRE)という考え方があります。これは「 …

サラリーマンが全資産の95%をインデックスファンド(S&P500・オルカン)で運用中。2024年に億り人達成!ブログで様々な投資シミュレーションを紹介!

お問い合わせは:こちら

にほんブログ村 株ブログ 米国株へ