【コンピューターVS人間】 「絶対に負けない」ポーカー・プログラム完成!「人間が統計的有意性を持ってプログラムに勝つのは不可能」
1: 2ちゃん@旬話まとめ 投稿日:2015/01/09(金) 17:06:22.30
【AFPBB News】 2015/01/09 13:06
【1月9日AFP】プレーヤー2人に限定したポーカーの「テキサス・ホールデム(Texas hold'em)」で、理論上絶対に負けないコンピュータープログラムを開発したとする研究論文が、8日の米科学誌サイエンス(Science)に掲載された。
論文の主執筆者、カナダ・アルバータ大学(University of Alberta)のマイケル・ボーリング(Michael Bowling)氏はAFPの取材に、研究チームは2003年より「現在の超一流プレーヤーに負けない、またどんな戦略にも負けない、完璧なプレーヤーを作り出すこと」を目標に掲げてきたと語る。
研究チームは2008年、ポラリス(Polaris)と呼ばれる最初のポーカー実行プログラムを完成させた。
ポラリスは、2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。
「この時点で、コンピューターはこの形式のポーカーでは全ての人間より強いプレーヤーとしての地位を確立した」とボーリング氏は言う。
ポラリスがポーカーで人間に勝てることが判明した後、「論理上の次なるステップは(このゲームを)解くことができるかの検討だった」と同氏は続けた。
4800個の中央演算処理装置(CPU)群がゲームを解決するための計算を開始した。「本質的にゲームを解決するという目標に到達するのに2か月あまりの計算を要した」と同氏は話す。
結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。
ボーリング氏は、電子メール取材に対し
「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」
と説明した。

■記事元:
https://daily.2ch.net/test/read.cgi/newsplus/1420790782/
■ソース:旬話速報
https://blog.livedoor.jp/murahiro1126/archives/1017377226.html
■コンピューター対人間
ゲームで人間を打ち負かしたコンピューターとしては、ポーカーの他にも1994年にボードゲーム「チェッカー」の世界選手権で初めて人間を破ったプログラム「チヌーク(Chinook)」や、1997年に当時のチェス世界チャンピオン、ガルリ・カスパロフ(Garry Kasparov)氏に勝った「ディープ・ブルー(Deep Blue)」などがある。
米コンピューター大手IBMが開発した高性能コンピューター「ワトソン(Watson)」は2011年、米国のクイズ番組「ジョパディ!(Jeopardy !)」で優勝した。
だがポーカーのテキサス・ホールデムは、特に難題であることが判明していた。プレーヤーが2人だけでも、どのカードがすでに相手の手札に入っているかなどの未知の情報が大量にあるからだ。
米カーネギーメロン大学(Carnegie Mellon University)のコンピュータ科学者、トゥオマス・サンドホルム(Tuomas Sandholm)氏は、数多くある「不完全情報ゲーム」のなかでも、ポーカーは人工知能(AI)にとっては最大級の挑戦だと、サイエンス誌に同時掲載された解説記事に記している。
同氏の説明によると、これらのいわゆる「不完全情報ゲーム」を解決するための一般的手法では、最初にゲーム全体を抽象化して「規模はより小さいが、戦略的に同様なゲームを生成し、均衡発見アルゴリズムで対応可能なサイズにまで縮小する」という。次に、抽象化した各ゲームを解決して均衡または均衡近傍を導き出し、それらの戦略を元のゲームに対応づける。
ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。
このポーカーに利用されたようなアルゴリズムの進歩は、現実世界の不確定性と不明情報を含む状況に対して意思決定を下す場合に、より効果的な解決策を見つける助けになるかもしれないと、論文は結論付けている。(c)AFP/Kerry SHERIDAN
■ソース:afpbb news
https://www.afpbb.com/articles/-/3036040
「勝利するためには戦わないこと」との結論を導き出す
どちらが先行か後攻かで勝負が決まる
引き分け
どっちが勝ってもどっちかが無敵
統計的には無理でも
そういう事だね。
>人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能である
逆に言えば、 有限回なら統計的有意性は無くても打ち負かす事は可能ってことだ。
>理論上絶対に負けないコンピュータープログラム
これは「大風呂敷広げすぎ」 だよ。 要約が悪いんだろうけど。
勝ち逃げしようとする人間を捕まえるための
ロボットアームも標準装備
カード操作でもしない限り、数回の勝負じゃ勝敗は運だろ
全部ブタなら勝ち目はないぞ
ブラフでレイズしたって相手がそれに付き合ってきたらどうすんだ
必ず相手を降ろさせる秘策でもあるのか?
でも、金持ち相手に稼いでいるプロたちは、多かれ少なかれ
ここまで洗練されてなくても、似たようなものだとは思う。
そういうロジックって存在するのか?
それができるならば麻雀も同じように必勝ロジックがありそうだな。
そういうの目指している人たちはいるよ。
科学する麻雀とか、勝つための現代麻雀技術論とかがその類いだな。冷徹な統計処理と確率論で麻雀技術を極めようとしている。
豪運招来プログラムとかそういうスピリチアルな話?
最良手順を計算し続けて、多くの対戦で結果的に勝つということだろ。
6maxノーリミットホールデ厶の解明せんと
研究者の名前でググったら確かにヘッズアップのリミットホールデムだね
プログラムと人間のプレーヤーが1対1、1回のベットで賭けられるチップの額に制限がありオールインベットで相手を一撃死させる事が実質的にできないルール
このスレで何人かが指摘しているようにトータルで勝てるってだけの意味であって1回毎にすべて勝つと言ってるわけではない
それならこういう結論を出せるのになんの不思議もない
この手のは組み合わせが増えると爆発的に演算量が増えて手に負えなくなる。