AH Tokyo 検索

カスタム検索

5/12/2010

ナッシュ均衡

日本人がこのような状況下で、おとなしいのは?

各人が偽りの「逃げ口上」を持っているのだろう・・・

おそらく、それこそが、象徴天皇に集約されるのでは?

後ろ向きの「逃げた天皇に未練はないが・・・」

実は、天皇のもとで、奴隷になった方が楽・・・

救いようがない・・・ 逃げ口上・・・




ゲーム理論のナッシュ均衡?

だから、お伽の国?

まるで、現実とかけ離れている日本・・・


どう考えても、異常、まるで、日本国は精神病患者のようだ・・・


原因は? コネクションマシンの挙句の果て?







ニッポン株式会社の本質は?

赤グロ団子型コネクションマシン




赤グロ団子型コネクションマシンがさらに性質が悪いのは?





バックワード型 = 後ろ向き = 皇国史観

回復不能、生命維持装置に繋ぐんですか?

三権の長へ・・・ その他、ニッポン株式会社の社主へ・・・

社主とは? 

法人の長である・・・ 国

家長である・・・ 家

国家が団子になって、破たんした、ご臨終です・・・


証拠は?

国(社)の財政 1200兆円の赤字

家の財政 家計は国の財政に連動している

家計は経済の最小単位である、国の財政は大赤字・・・ 税金で穴埋めしなくてはならない

お宅の金融資産の状況は?

住宅ローン赤字です・・・

うちは、不渡りです

うちは、ゼロです、まだ、まし・・・




---Wiki


コネクションマシンConnection Machine)は、スーパーコンピュータシリーズの名称である。1980年代初頭、マサチューセッツ工科大学の Danny Hillis によるノイマン型コンピュータの代替となるアーキテクチャの研究から発展して製品化された。最初の CM-1 は、MITで考案されたもので、数千の単純なプロセッサノード(それぞれにRAMを持つ)をハイパーキューブ型に接続した超並列マシンであり、各CPUノードにはRAMを持ちSIMD方式で動作した。人工知能や記号処理に使うことを目的としていたが、計算科学分野で成功した。
Hillis と Sheryl Handler はシンキングマシンズ社をマサチューセッツ州 Waltham に設立し(1983年)、CM-1 を製造し、後に最大 65,536プロセッサ構成の CM-2を開発した。各プロセッサは非常に単純な 1ビットプロセッサである。後に数値演算コプロセッサWeitek 3132)を追加できるように改良され、32ノードがひとつの数値演算コプロセッサを共有する構成となっていた。CM-2 の小規模版 CM-2a(最大 4096プロセッサか 8192プロセッサ)や、高速版CM-200 も後にリリースされた。



---Wiki


ナッシュ均衡(ナッシュきんこう、Nash equilibrium)は、ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。数学者のジョン・フォーブス・ナッシュにちなんで名付けられた。
ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。
ナッシュ均衡は、必ずしもパレート効率的ではない。その良い例が、囚人のジレンマである。

定義 [編集]

形式的な定義は次の通りである。標準型ゲーム G = (NSu) (N はプレーヤーの集合、S = \prod_{i \in N} S_i は戦略の組の集合、u = (u_i)_{i \in N} \; (u_i : S \rightarrow \mathbb{R}) は効用の組)において、戦略の組 s^* \in S がナッシュ均衡であるとは、全てのプレーヤー i \in N と、全ての s_i \in S_i に対して、
 u_i(s^*) \geq u_i(s_i, s^*_{-i})
を満たすことである。
ただし、s-i は、i 以外のプレーヤーの戦略の組をさす。

純粋戦略ゲームとナッシュ均衡 [編集]

支配戦略によるナッシュ均衡 [編集]

純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー Pa と Pb がそれぞれ戦略 (A1 または A2) と (B1 または B2) を選べるときの、それぞれの利得を示す。並んだ数字の左側は Pa の利得、右側は Pb の利得である。
Pa/PbB1B2
A15, 22, 4
A24, 61, 6
まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。
次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2は同等になるので、このような関係のとき B2 は弱支配戦略であるという。
結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) がナッシュ均衡となる。
Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更して A2 をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。同様に Pb も、戦略を変更して B1 をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。
なお、Pa、Pb が (A2, B1) という戦略をとった場合の利得は (4, 6) となり、ナッシュ均衡における利得と比べて Pa、Pb ともにより大きな利得を得ることができる。この場合、Pa がより大きな 5 の利得を得るため A1 に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。また、(A1, B2) から (A2, B1) への戦略変更は、パレート改善であり、ナッシュ均衡 (A1, B2) はパレート効率的ではない。

逐次消去によるナッシュ均衡 [編集]

相手の戦略によってどの戦略が最も大きな利得を出すかが変化する場合、他の戦略すべてを支配できる戦略が存在しない場合がある。そのような場合、他から支配されている戦略を消去していくことで残った戦略の組み合わせをナッシュ均衡と定義できる。支配戦略によってナッシュ均衡が定義できる場合、それは消去によって定義されたものと一致する。
Pa/PbB1B2B3
A15, 22, 44, 0
A24, 63, 62, 5
A33, 31, 27, 2
↓B3 は B2 に支配されているため、B3 を消去。
Pa/PbB1B2
A15, 22, 4
A24, 63, 6
A33, 31, 2
↓A3 は A2 に支配されているため A3 を消去。
Pa/PbB1B2
A15, 22, 4
A24, 63, 6
↓B1 は B2 に支配されているため B1 を消去。
Pa/PbB2
A12, 4
A23, 6
ナッシュ均衡は (A2, B2)。

混合戦略ゲームにおけるナッシュ均衡 [編集]

混合戦略ゲームとは、参加者が各行動を選ぶ確率を戦略とするような非協力ゲームのことである。この場合、ナッシュ均衡は各参加者の行動確率の組として表される。有限ゲーム (プレーヤーの数と各プレーヤーの戦略の数が有限のゲーム) は少なくとも 1 つのナッシュ均衡を (混合戦略ゲームで考えれば) 持つことが証明されている (ナッシュの定理。ナッシュは、この証明を角谷不動点定理を応用することによって得た)。
Pa/PbB1
確率 q
B2
確率 (1 - q)
A1
確率 p
1, 20, 0
A2
確率 (1 - p)
0, 02, 1
この表のゲームの場合は Pa の得る利得の期待値は:
1・pq + 2・(1 - p)(1 - q) = 3pq - 2p - 2q + 2 = (3q - 2)p + 2(1 - q)
である。これを p の関数だと考えると:
  • q > 2/3 なら:単調増加の直線グラフなので、期待値の最大値は p = 1 のとき q
  • q < 2/3 なら:単調減少の直線グラフなので、期待値の最大値は p = 0 のとき 2 - 2q
  • q = 2/3 なら:期待値は一定で 2/3
となる。
Pb の得る利得の期待値の最大値も、p によって同様に決定される。この二つのグラフの交点がナッシュ均衡となる。このゲームの場合は (2/3, 1/3) がそうである。

関連項目 [編集]



---Wiki

こちらのほうが分かりやすい・・・



囚人のジレンマ(しゅうじん - 、Prisoners' Dilemma)は、ゲーム理論経済学において、個々の最適な選択が全体として最適な選択とはならない状況の例としてよく挙げられる問題。非ゼロ和ゲームの代表例でもある。この問題自体はモデル的であるが、実社会でもこれと似たような状況(値下げ競争、環境保護など)は頻繁に出現する。
1950年アメリカ合衆国ランド研究所メリル・フラッド (Merrill Flood) とメルビン・ドレシャー (Melvin Dresher) が考案し、顧問のアルバート・W・タッカー (A.W.Tucker) が定式化した。

目次

 [非表示]

囚人のジレンマ [編集]

問題 [編集]

共同で犯罪を行った(と思われる)2人が捕まった。警官はこの2人の囚人に自白させる為に、彼らの牢屋を順に訪れ、自白した場合などの司法取引について以下の条件を伝えた。
  • もし、おまえらが2人とも黙秘したら、2人とも懲役2年だ。
  • だが、共犯者が黙秘していても、おまえだけが自白したらおまえだけは刑を1年に減刑してやろう。ただし、共犯者の方は懲役15年だ。
  • 逆に共犯者だけが自白し、おまえが黙秘したら共犯者は刑が1年になる。ただし、おまえの方は懲役15年だ。
  • ただし、おまえらが2人とも自白したら、2人とも懲役10年だ。
なお、2人は双方に同じ条件が提示されている事を知っているものとする。また、彼らは2人は別室に隔離されていて、2人の間で強制力のある合意を形成できないとする。
このとき、囚人は共犯者と協調して黙秘すべきか、それとも共犯者を裏切って自白すべきか、というのが問題である。
2人の囚人の名前をA、Bとして表にまとめると、以下のようになる。表内の左側が囚人Aの懲役、右側が囚人Bの懲役を表す。たとえば右上の欄は、Aが懲役15年、Bが1年である事を意味する。
囚人B 協調囚人B 裏切り
囚人A 協調(2年、2年)(15年、1年)
囚人A 裏切り(1年、15年)(10年、10年)

解説 [編集]

囚人2人にとって、互いに裏切りあって10年の刑を受けるよりは互いに協調しあって2年の刑を受ける方が得である。しかし囚人達が自分の利益のみを追求している限り、互いに裏切りあうという結末を迎える。なぜなら囚人Aは以下のように考えるからだ。
  1. 囚人Bが「協調」を選んだとする。このとき、もし自分 (=A) がBと協調すれば自分は懲役2年だが、逆に自分がBを裏切れば懲役は1年ですむ。だからBを裏切ったほうが得だ。
  2. 囚人Bが「裏切り」を選んだとする。このとき、もし自分がBと協調すれば自分は懲役15年だが、逆に自分がBを裏切れば懲役は10年ですむ。だからBをやはり裏切ったほうが得だ。
以上の議論により、Bが自分との協調を選んだかどうかによらずBを裏切るのが最適な戦略(支配戦略)であるので、AはBを裏切る。囚人Bも同様の考えにより、囚人Aを裏切る事になる。
よってA、Bは(互いに裏切りあうよりは)互いに協調しあったほうが得であるにもかかわらず、互いに裏切りあって10年の刑を受ける事になる。合理的な各個人が自分にとって「最適な選択」(裏切り)をすることと、全体として「最適な選択」をすることが同時に達成できないことがジレンマと言われる所以である。
なお、この場合のパレート効率的な組合せは、(2,2)、(15,1)、(1,15)の3点であり、(10,10) はナッシュ均衡ではあってもパレート効率的ではない。

繰り返し型の囚人のジレンマ [編集]

上述したように、2人プレーヤーの囚人のジレンマのゲームを1回しかしない場合は、両者が「裏切り」を選択する。では囚人のジレンマのゲームを繰り返し行った場合はどうなるか。これは、囚人達がゲームの繰り返し回数を知っているかどうかによって変わる。
ゲームの繰り返し回数を囚人達が双方とも知っていた場合は、全ての回で囚人がともに「裏切り」を選択する事が分かっている。これは状況を最終回から順に帰納法的に考えてみれば分かる(後退帰納法)。
  • 最終回のゲームの後にもうゲームをやらないので、最終回のゲームの戦略が他のゲームの戦略に影響する事はない。よって最終回のゲームの戦略はゲームを一回しかやらない場合の戦略と同様であり、囚人はともに「裏切り」を選択する。
  • 最終回のゲームでは双方とも必ず「裏切り」を選択するのだから、最終回の一回前のゲームで自分が「協調」を選択しようが「裏切り」を選択しようが最終回のゲームには影響しない。よって最終回の一回前のゲームにもやはり駆け引き的要素は存在せず、このゲームでも囚人達はともに「裏切り」を選択する。
  • 以下同様に考える事で、全てのゲームで囚人がともに「裏切り」を選択する事が分かる。
次にゲームの繰り返し回数をいずれの囚人も知らない場合を考える1980年ロバート・アクセルロッドは、繰り返し型の囚人のジレンマで利得の多くなる戦略を調べるため、様々な分野の研究者から戦略を集めて実験を行った。実験には14種類の戦略が集まり、アクセルロッドはこれらを総当りで対戦させた。その結果、全対戦の利得の合計が最も高かったのは、「しっぺ返し戦略(tit for tat)」であった。「しっぺ返し戦略」とは、最初は「協調」し、以降は、前回相手の出した手をそのまま出す戦略である。
アクセルロッドは、続いて2回目の実験を行った。この実験には、62種類の戦略が集まった。前回の勝者が「しっぺ返し戦略」であることは伝えられていたため、集まった戦略はこれよりも高い利得を得ようと工夫されたものだった。それにもかかわらず、最大の利得を得たのは、またしても「しっぺ返し戦略」であった。
なお、実験の結果は、実験の具体的方法や他の戦略の種類、数にも影響されるため、「しっぺ返し戦略」が常に最強とは限らない。しかし、ある条件下では「しっぺ返し」戦略が「常に裏切り」戦略よりも有効であることを以下のように示すことができる。
例えば、2人のプレーヤーPaとPbが「協調」か「裏切り」かの戦略を選べるときの、それぞれの利得を示す。並んだ数字の左側はPaの利得、右側はPbの利得である。
Pa/Pb協調裏切り
協調2, 20, 3
裏切り3, 01, 1
ゲームが1回きりの場合、前に述べたとおり、ナッシュ均衡は(裏切り, 裏切り)のみである。しかし、ゲームを複数回行う場合、ゲームが次回も続く確率をpとすると、利得は以下のようになる。
Pa/Pbしっぺ返し常に裏切り
しっぺ返し2/(1-p), 2/(1-p)-1+1/(1-p), 2+1/(1-p)
常に裏切り2+1/(1-p), -1+1/(1-p)1/(1-p), 1/(1-p)
この場合、p>0.5において2+1/(1-p)<2/(1-p)となる。すなわち、相手が「しっぺ返し」戦略をとっている時に自分が「常に裏切り」戦略を取る利得がなくなり、(しっぺ返し,しっぺ返し)がナッシュ均衡となる。

繰り返し型の囚人のジレンマゲーム(ノイズあり) [編集]

また、ノイズあり「繰り返し型の囚人のジレンマゲーム」というものが、考えられる。ここでノイズとは、「相手が協調しているにも関わらず、なんらかの理由で、裏切ったと解釈されてしまう」(あるいは逆に、裏切っているにも関わらず協調していると思い込む)というものである。
ノイズあり「繰り返し囚人のジレンマゲーム」では、しっぺ返し戦略はもはや最強ではなく、パブロフ戦略が強くなる。これは、前回うまくいったら今回も同じ行動を、前回失敗したら今回はその反対の行動をとるという戦略である。ノイズはどんなに微小であっても、しっぺ返しよりパブロフの方が強いことが理論的に示せる。また、ノイズがあってもなくても社会全体が、突然変異を除き1つの戦略で一様に覆われてしまうことは変わらない。

その他 [編集]

しっぺ返し戦略とパブロフ戦略は、前回の行動のみから今回の行動を決定するというタイプの戦略であるが、これをもっと以前の情報をもとに今回の行動を決められるように、戦略空間を拡大することを考える。
すると、社会全体がある戦略に収束するのではなく、さまざまな戦略が誕生しては滅んでゆくような終わりなき進化がおこりうることがリンドグレーンによって示された。

現実における囚人のジレンマ [編集]

現実世界でも囚人のジレンマないしそれに類似した例を見つける事ができる。例えば核開発では、A国とB国が両方とも核開発を止めれば平和が維持できるにもかかわらず、相手国が裏切って核開発をはじめる恐怖に耐え切れず、双方とも核開発をはじめてしまう(恐怖の均衡)。また低価格競争でも、A社とB社が両方とも値下げを止めれば利益を維持できるにもかかわらず、相手企業の値下げによりシェアが奪われる恐怖に耐え切れず、双方ともに値下げ合戦をして利益を圧縮してしまう。このように囚人のジレンマは政治経済の解析にかかせない。

関連項目 [編集]

0 件のコメント:

The Definition Of Art Harbour Blog



The Definition Of Art Harbour


Virtual International Trade Harbours Of Art


Opening Anniversary Date: December 1, 2006

Language: Multi Language


Each harbour can export the works toward the virtual world.

People and organization can import the works from all over the world.


Now,Item: Works on Art Activities that are expressed with Photos and Explanations etc.

Export Method: Each Harbour put the Works onto this blog

Import Method: People and Organizations accsess this blog

Order Method: People and Organizations put some comments about the Works onto this blog.


In the future, we will need transportation including trains,airplanes,ships, cars, buses etc.

in order to export and import people, goods etc. ?


Art Harbour


アート・ハーバーとは


アートのバーチャル国際貿易港


開港記念日:2006年12月1日

言語:マルチ言語


各港は、バーチャルな世界へ向けて、作品を輸出できる

人や組織などは、バーチャルな世界から、作品を輸入できる


現時点輸出品目: アートに関する活動などを「写真と文などで表現した作品」

輸出方法: 各港で作品をこのブログに書き込むことで、輸出したものとみなす

輸入方法: 人や組織が作品をこのブログで参照することで、輸入したものとみなす

注文方法: 感想などをコメントに入れることで、注文したものとみなす


将来、、、列車、飛行機、船、車、バスなどを利用して、リアルな人や物が輸出入できる?


アート・ハーバー

Multi Language

現時点では?


ブログは日本語ベース


Google Translatorで、各国語へ、変換




そして、現場で、リアルなコミュニケーションは?


英語ベースで、現地語がお愛想・・・


こんな感じかな?


Aoyagi YoSuKe

Art HarbOur


The Gaiaと各ハブは?


英語がベースで、Google Translatorで、各国語へ・・・

Copyright and Responsibility of AH Shimokitazawa blog



Copyright:


Each manager or each member of Each AH Local must independently handle Copyright.


Each may insist on Copyright or discard Copyright independently.


Copyright depends on each manager or each member.


Responsibility:


Each manager or each member of Each AH Local

must independently have the resposibility on the posted works.

Art Harbour Shimokitazawa


コピーライト:

各アート・ハーバーのマネージャーまたはメンバーは

各々でコピーライトの取り扱いをしなければならない。

コピーライトを主張するか破棄するかは各々に任される。


責任:


各アート・ハーバーのマネージャーまたはメンバーは

各々が投稿した作品に関して責任を持たなければならない。


アート・ハーバー 下北沢


Posting Rule - 掲載ルール




Introducing People, Works, Shops etc. related to Art Harbour as a spot ad.


As a general rule, the details such as map, price should be in the Official Sites related to the ad.

Each ad may contain the Official Sites' URL related to the ad.


Restriction: The Number of Photos is within 6(basically 3). about 640x480 pixel


Ad Size: Within about 2 standard printing papers.


Example: Spot ad. , Flyer, Live Report, Poem, Short Story, Illustraltion, Photo, Paintings etc.


Art Harbour Shimokitazawa



アート・ハーバーに関連した人、作品、店などをスポット広告として紹介する。


原則として、地図や価格などの詳細は広告に関連したオフィシャル・サイトに掲載する。


各広告には関連オフィシャル・サイトのURLを掲載しても良い。


制限:写真など6枚以内(基本は3枚) 1枚に付き640×480ピクセル程度


サイズ:標準プリント用紙(A4)約2枚以内


例:スポット広告、フライヤー、ライブの報告、詩、イラスト、絵など



アート・ハーバー 下北沢