It has been suggested that this article be split out into a new article titled General video game playing. (Discuss) (June 2023) |
| Part of a series on |
| Artificial intelligence (AI) |
|---|
汎用ゲームプレイ(GGP )とは、複数のゲームを成功裏にプレイできるように人工知能プログラムを設計することです。 [1] [2] [3]チェスのような多くのゲームでは、コンピュータは特別に設計されたアルゴリズムを用いてこれらのゲームをプレイするようにプログラムされていますが、このアルゴリズムは他のコンテキストには転用できません。例えば、チェスをプレイするコンピュータプログラムはチェッカーをプレイできません。汎用ゲームプレイは、人工知能(GGP)への道における必須のマイルストーンと考えられています。[4]
一般的なビデオゲームのプレイ (GVGP )は、ビデオゲームをプレイする目的に合わせて調整されたGGPの概念です。ビデオゲームの場合、ゲームのルールは、TD-Gammon [5]のように人工プレイヤーによって複数回の反復で学習されるか、従来のGGPのようにドメイン固有言語で手動で事前定義され、人工プレイヤーに事前に送信される必要があります[6] [7]。2013年以降、深層強化学習アプローチに従って大きな進歩が遂げられ、 Atari 2600ゲームをプレイすることを学習できるプログラム[8] [5] [9] [10] [11]やNintendo Entertainment Systemゲームをプレイすることを学習できるプログラムの開発などが行われました。[12] [13] [14]
汎用ゲーム技術の最初の商用利用は1998年のZillions of Gamesでした。汎用ゲーム技術は、2003年以降、オンラインオークションでの価格交渉において、サプライチェーン管理におけるトレーディングエージェント向けにも提案されました。 [15] [16] [17] [18]
歴史
This section needs to be updated. (October 2021) |
1992年、バーニー・ペルはメタゲームプレイの概念を定義し、「MetaGame」システムを開発しました。これはチェス風のゲームルールを自動生成する最初のプログラムであり、自動ゲーム生成を用いた初期のプログラムの一つでした。その後、ペルはMetagamerシステムを開発しました。[19]このシステムは、ゲーム記述言語(GDL)と呼ばれる特別な言語でゲームルールを定義し、ゲームが生成された後、人間の介入なしにチェス風のゲームを数多くプレイすることができました。 [20]
1998年、ジェフ・マレットとマーク・レフラーによって商用システム「Zillions of Games」が開発されました。このシステムはLISP風の言語を用いてゲームルールを定義しました。Zillions of Gamesは、駒の移動、盤面構造、ゲームの目標に基づいて、ゲームルールから評価関数を自動的に導出しました。また、コンピュータチェスシステムに見られる一般的なアルゴリズム、例えば着手順序付けによるアルファベータプルーニング、転置表なども採用していました。 [21]このパッケージは2007年に拡張され、Forthベースの完全なプログラミング言語を組み込んだ代替メタゲームエンジンであるAxiomプラグインが追加されました。
1998年、ウルス・フィッシュバッハーによってz-Treeが開発されました。[22] z-Treeは、実験経済学における最初の、そして最も引用されているソフトウェアツールです。z-Treeは、人間を被験者とするゲーム理論的実験のためのゲームルールをz-Tree言語で定義することを可能にします。また、人間を被験者とするゲームに参加するコンピュータプレイヤーを定義することもできます。[23]
2005年にスタンフォード・プロジェクト・ジェネラル・ゲーム・プレイングが設立された。[3]
2012年にPyVGDLの開発が開始されました。[24]
GGPの実装
スタンフォードプロジェクト
General Game Playingは、カリフォルニア州スタンフォード大学のスタンフォード論理グループによるプロジェクトで、一般的なゲームプレイのためのプラットフォームの構築を目指しています。これはGGP AIの標準化における最も有名な取り組みであり、一般的にGGPシステムの標準とみなされています。ゲームは、ゲーム記述言語(Game Description Language)で表現された一連のルールによって定義されます。ゲームをプレイするために、プレイヤーはゲームホスティングサーバー[25] [26]と対話します。ゲームホスティングサーバーは、動きの正当性を監視し、プレイヤーに状態の変化を通知します。
2005年以来、 AAAIカンファレンスでは毎年、一般ゲームプレイ競技会が開催されています。この競技会では、各ゲームにおけるAIのパフォーマンスを記録し、競技参加者のAIの様々なゲームをプレイする能力を競います。競技会の第1ステージでは、参加者は、合法的な動きを実行する能力、優位に立つ能力、そしてより速くゲームを完了する能力について審査されます。続く決勝ラウンドでは、AIは徐々に複雑なゲームで互いに対戦します。このステージで最も多くのゲームに勝利したAIが優勝し、2013年まではその開発者は1万ドルの賞金を獲得していました。[19]これまでに、以下のプログラムが優勝しています。[27]
| 年 | 名前 | 開発者 | 機関 | 参照 |
|---|---|---|---|---|
| 2005 | クルーンプレイヤー | ジム・クルーン | UCLA | |
| 2006 | フラックスプレイヤー | ステファン・シッフェルとマイケル・ティールシャー | ドレスデン工科大学 | [28] |
| 2007 | カディアプレイヤー | イングヴィ・ビョルンソンとヒルマー・フィンソン | レイキャビク大学 | [29] |
| 2008 | カディアプレイヤー | イングヴィ・ビョルンソン、ヒルマー・フィンソン、ギルフィ・ソル・グズムンドソン | レイキャビク大学 | |
| 2009 | アリ | ジャン・メハ | パリ第8大学 | |
| 2010 | アリ | ジャン・メハ | パリ第8大学 | |
| 2011 | ターボタートル | サム・シュライバー | ||
| 2012 | カディアプレイヤー | ヒルマー・フィンソンとイングヴィ・ビョルンソン | レイキャビク大学 | |
| 2013 | ターボタートル | サム・シュライバー | ||
| 2014 | サンチョ | スティーブ・ドレイパーとアンドリュー・ローズ | [30] | |
| 2015 | 活性化 | リチャード・エムズリー | ||
| 2016 | ウッドストック | エリック・ピエット | アルトワ大学 |
他のアプローチ
ゲームルールを定義するために独自の言語を使用するその他の一般的なゲーム プレイ ソフトウェアには、次のものがあります。
| システム | 年 | 説明 |
|---|---|---|
| フラマシ | 2009 | Rustam Tagiewによって一般的なゲームプレイと経済実験のために開発されました。[31] [32] |
| あいあい | 2015-2017 | スティーブン・タベナー(元Zillions開発者)によって開発された。[33] [34] [35] |
| ポリガモプレイヤー | 2017 | 2017年9月にDavid M. BennettによってUnityゲームエンジンに基づいてリリースされました。[36] |
| 通常のボードゲーム | 2019 | ヴロツワフ大学のJakub Kowalski、Marek Szykułaらのチームによって開発された。[37] [38] |
| ルディ | 2020 | これは、ERCの資金提供を受けたDigital Ludemeプロジェクトの一環として、マーストリヒト大学のキャメロン・ブラウンと彼のチームによって公開された。[39] [40] [41] |
GVGP実装
強化学習
GVGPは、実際のビデオゲームAIを自動的に作成するだけでなく、「手続き型コンテンツ生成を使用して自動的に作成されたものを含むゲーム環境をテストし、人間のプレイヤーが悪用する可能性のあるゲームプレイの潜在的な抜け穴を見つける」ためにも使用できる可能性があります。[7] GVGPは、ゲームルールを生成したり、ゲームが許容する優れたAIと劣ったAIのスキルの差異を比較する相対アルゴリズムパフォーマンスプロファイル(RAPP)に基づいてゲームの品質を推定したりするためにも使用されています。[42]
ビデオゲーム記述言語
汎用ビデオゲームAIコンペティション(GVGAI)は2014年から開催されている。このコンペティションでは、GGPコンペティションで使用されるボードゲームの代わりに、1980年代のアーケードゲームやコンソールゲームに類似した(場合によっては1980年代のゲームをベースにした)2次元ビデオゲームが使用される。研究者や実務家が、最良の汎用ビデオゲームプレイアルゴリズムをテストし、比較する方法を提供している。このコンペティションには、ビデオゲーム記述言語(VGDL)で書かれた多数のゲームを含む関連ソフトウェアフレームワークがある。VGDLはGDLと混同しないようにする必要があるが、簡単に解析できる単純なセマンティクスとコマンドを使用するコーディング言語である。VGDLの一例として、2013年に開発されたPyVGDLがある。[6] [24] GVGPで使用されているゲームは、今のところ、最も単純で定量化しやすい2次元アーケードゲームであることが多い。[43]ビデオゲームを解釈できるAIの作成プロセスを簡素化するために、この目的のためのゲームはVGDLで手動で書かれている。[要説明] VGDLは、アンサーセットプログラミング(ASP)と進化アルゴリズム(EA)を用いて、特に手続き型レベルの生成に特化したゲームを記述するために使用できます。GVGPは、手続き型レベルの妥当性、およびエージェントのパフォーマンスに基づくレベルの難易度や品質をテストするために使用できます。[44]
アルゴリズム
GGP AIは複数のゲームをプレイできるように設計する必要があるため、特定のゲームに特化したアルゴリズムに依存することはできません。代わりに、幅広いゲームに適用できるアルゴリズムを用いてAIを設計する必要があります。Regular Boardgames (RBG)やLudiiといった最近のGGPシステムは、推論効率を最適化し、より多様なゲームをサポートするために、代替的なルール表現を研究してきました。AIはまた、過去の状態の出力ではなく、現在の状態に適応できる継続的なプロセスである必要があります。このため、オープンループ技術が最も効果的であることが多いです。[45]
GGP AIを開発するための一般的な方法は、モンテカルロ木探索(MCTS)アルゴリズムです。[46] UCT法(木に適用される上側信頼境界)と併用されることが多く、MCTSのバリエーションは、特定のゲームをより良くプレイするため、またビデオゲームのプレイとの互換性を持たせるために提案されています。[47] [48] [49]使用される木探索アルゴリズムの別のバリエーションは、有向幅優先探索(DBS)です。[50]これは、利用可能なアクションごとに現在の状態への子ノードを作成し、ゲームが終了するか時間切れになるまで、平均報酬が最も高い順に各子を訪問します。[51]各木探索方法において、AIは潜在的なアクションをシミュレートし、獲得したポイントに関して各パスの平均最高報酬に基づいてそれぞれをランク付けします。[46] [51
仮定
ゲームとインタラクションを行うには、アルゴリズムはゲームが共通の特性を持っているという仮定の下で動作する必要がある。著書『Half-Real: Video Games Between Real Worlds and Fictional Worlds』の中で、ジェスパー・ユールはゲームを次のように定義している。「ゲームはルールに基づいており、結果は変動し、結果が異なれば価値も異なり、プレイヤーの努力が結果に影響を与え、プレイヤーは結果に執着し、ゲームの結果は交渉可能である。」[52] これらの仮定を用いることで、プレイヤーの入力、ゲームの結果、そして様々なルールの適用方法を定量化し、アルゴリズムを用いて最も好ましいパスを計算することで、ゲームをプレイするAIを作成することができる。[43]
参照
参考文献
- ^ Pell, Barney (1992). H. van den Herik; L. Allis (編). 「メタゲーム:ゲームと学習への新たな挑戦」 [人工知能におけるヒューリスティックプログラミング 3 – 第3回コンピュータオリンピック] (PDF) . Ellis-Horwood. 2020年2月17日時点のオリジナルよりアーカイブ(PDF) . 2020年2月17日閲覧。
- ^ ペル、バーニー (1996). 「チェスのような一般ゲームにおける戦略的メタゲームプレイヤー」.計算知能. 12 (1): 177– 198. doi :10.1111/j.1467-8640.1996.tb00258.x. ISSN 1467-8640. S2CID 996006.
- ^ ab ジェネセレス, マイケル; ラブ, ナサニエル; ペル, バーニー (2005年6月15日). 「一般ゲームプレイ:AAAI大会の概要」. AIマガジン. 26 (2): 62. doi :10.1609/aimag.v26i2.1813. ISSN 2371-9621.
- ^ カナン, ロドリゴ; サルゲ, クリストフ; トゲリウス, ジュリアン; ニールン, アンディ (2019). Proceedings of the 14th International Conference on the Foundations of Digital Games [ Proceedings of the 14th International Conference on the Leveling the playing field: Fairness in AI versus human game benchmarks ]. pp. 1– 8. doi :10.1145/3337722. ISBN 9781450372176. S2CID 58599284。
- ^ ab Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Graves, Alex; Antonoglou, Ioannis; Wierstra, Daan; Riedmiller, Martin (2013). 「深層強化学習でAtariをプレイする」(PDF) . Neural Information Processing Systems Workshop 2013. 2014年9月12日時点のオリジナルよりアーカイブ(PDF) . 2015年4月25日閲覧.
- ^ ab Schaul, Tom (2013年8月). 「モデルベースまたはインタラクティブ学習のためのビデオゲーム記述言語」. 2013 IEEE Conference on Computational Intelligence in Games (CIG) . pp. 1– 8. CiteSeerX 10.1.1.360.2263 . doi :10.1109/CIG.2013.6633610. ISBN 978-1-4673-5311-3. S2CID 812565。
- ^ ab Levine, John; Congdon, Clare Bates; Ebner, Marc; Kendall, Graham; Lucas, Simon M.; Miikkulainen, Risto; Schaul, Tom; Thompson, Tommy (2013). 「一般的なビデオゲームのプレイ」.ゲームにおける人工知能と計算知能. 6. Schloss Dagstuhl–Leibniz-Zentrum fuer Informatik: 77– 83. 2016年4月9日時点のオリジナルよりアーカイブ。 2015年4月25日閲覧。
- ^ Bowling, M.; Veness, J.; Naddaf, Y.; Bellemare, MG (2013-06-14). 「アーケード学習環境:汎用エージェントの評価プラットフォーム」. Journal of Artificial Intelligence Research . 47 : 253–279 . arXiv : 1207.4708 . doi :10.1613/jair.3912. ISSN 1076-9757. S2CID 1552061.
- ^ ムニフ、ヴォロディミル;カヴククオール、コライ州。シルバー、デイビッド。ルス、アンドレイ A.ヴェネス、ジョエル。ハサビス、デミス。ベルマーレ、マーク G.グレイブス、アレックス。リードミラー、マーティン。フィジェランド、アンドレアス K.スティグ・ピーターセン、ゲオルグ・オストロフスキー。ビーティ、チャールズ。サディク、アミール。アントノグルー、イオアニス。キング、ヘレン。クマラン、ダルシャン。ヴィアストラ、ダーン。レッグ、シェーン(2015年2月26日)。 「深層強化学習による人間レベルの制御」。自然。518 (7540): 529–533。ビブコード:2015Natur.518..529M。土井:10.1038/nature14236. PMID 25719670。S2CID 205242740 。
- ^ Korjus, Kristjan; Kuzovkin, Ilya; Tampuu, Ardi; Pungas, Taivo (2014). 「論文『深層強化学習によるAtariのプレイ』の再現」(PDF) .タルトゥ大学. 2014年12月18日時点のオリジナルよりアーカイブ(PDF) . 2015年4月25日閲覧.
- ^ Guo, Xiaoxiao; Singh, Satinder; Lee, Honglak; Lewis, Richard L.; Wang, Xiaoshi (2014). 「オフライン・モンテカルロ木探索計画を用いたリアルタイムAtariゲームプレイのためのディープラーニング」(PDF) . NIPS Proceedings β . Conference on Neural Information Processing Systems . 2015年11月17日時点のオリジナルよりアーカイブ(PDF) . 2015年4月25日閲覧.
- ^ マーフィー、トム (2013). 「スーパーマリオブラザーズの最初のレベルは、辞書式順序とタイムトラベルを使えば簡単です…その後は少し難しくなります。」(PDF) . SIGBOVIK. 2013年4月26日時点のオリジナルよりアーカイブ(PDF) . 2015年4月25日閲覧。
- ^ マーフィー、トム. 「learnfun & playfun: NESゲームを自動化するための一般的なテクニック」. 2015年4月19日時点のオリジナルよりアーカイブ。2015年4月25日閲覧。
- ^ Teller, Swizec (2013年10月28日). 「Week 2: Level 1 of Super Mario Bros. is easy with lexicographic ordered and」. A geek with a hat . 2015年4月30日時点のオリジナルよりアーカイブ。 2015年4月25日閲覧。
- ^ マクミレン、コリン (2003). 2003年トレーディングエージェントコンペティションにおけるサプライチェーンマネジメントゲームのためのインテリジェントエージェントの開発に向けて[ 2003 Trading Agent Competition ] (論文). 修士論文. ミネアポリス、ミネソタ州: ミネソタ大学. S2CID 167336006.
- ^ Zhang, Dongmo (2009).汎用ゲーム記述から汎用トレーディングエージェントのための市場仕様言語へ[エージェント介在型電子商取引. 電子市場におけるトレーディング戦略とメカニズムの設計. ]. ベルリン, ハイデルベルク: Springer. pp. 259– 274. Bibcode :2010aecd.book..259T. CiteSeerX 10.1.1.467.4629 .
- ^ “AGAPE - An Auction LanGuage for GenerAl Auction Players”. AGAPE (フランス語). 2019年3月8日. 2021年8月2日時点のオリジナルよりアーカイブ。 2020年3月5日閲覧。
- ^ Michael, Friedrich; Ignatov, Dmitry (2019). 「BtoB価格交渉における一般的なゲームプレイ」(PDF) . CEURワークショップ議事録. -2479: 89– 99. 2019年12月6日時点のオリジナルよりアーカイブ(PDF) . 2020年3月5日閲覧。
- ^ ab Barney Pell のコンピューターゲームプレイに関する研究、Wayback Machineに 2007-08-12 アーカイブ。
- ^ “メタゲームと一般的なゲームプレイ”.メタゲームと一般的なゲームプレイ. 2001年3月3日時点のオリジナルよりアーカイブ。 2016年3月27日閲覧。
- ^ 入手可能: Universal Game Engine Archived 2012-11-03 at the Wayback Machine email to comp.ai.games by Jeff Mallett, 10-Dec-1998.
- ^ 「UZH - z-Tree - Zurich Toolbox for Readymade Economic Experiments」www.ztree.uzh.ch . 2016年2月21日時点のオリジナルよりアーカイブ。2020年2月17日閲覧。
- ^ ベッケンカンプ, マーティン; ヘニング=シュミット, ハイケ; マイヤー=リゴー, フランク・P. (2007年3月1日). 「対称的および非対称的な囚人のジレンマゲームにおける協力」. 社会科学研究ネットワーク. SSRN 968942.
- ^ ab シャウル、トム (2020 年 2 月 7 日)。 「schau/py-vgdl」。GitHub。 2018年6月11日のオリジナルからアーカイブ。2020 年2 月 9 日に取得。
- ^ GGP Server Archived 2014-02-21 at the Wayback Machine、一般的なゲームプレイシステムの競争のためのプラットフォーム。
- ^ Dresden GGP Server Archived 2013-04-07 at the Wayback Machine、試合の自動スケジュール機能を備えた一般的なゲーム プレイ システムの競争のためのプラットフォーム。
- ^ “General Game Playing”. www.general-game-playing.de . 2008年12月26日時点のオリジナルよりアーカイブ。 2008年8月21日閲覧。
- ^ Fluxplayer に関する情報 Archived 2011-07-19 at the Wayback Machine、第 2 回 International General Game Playing コンテスト優勝者。
- ^ CADIAPlayer に関する情報 (2011-07-22 Archived at the Wayback Machine)、第 3 回、第 4 回、および第 8 回国際総合ゲームプレイ競技会の優勝者に関する詳細情報。
- ^ サンチョは2014年のGGPチャンピオンです! Archived 2015-12-22 at the Wayback Machine、2014年の国際一般ゲームプレイコンテスト優勝者。
- ^ Tagiew, Rustam (2009). Filipe, Joaquim; Fred, Ana; Sharp, Bernadette (編). 戦略的インタラクションの管理のための枠組みに向けて [エージェントと人工知能に関する国際会議議事録] (PDF) . ポルトガル、ポルト. pp. 587– 590. ISBN 978-989-8111-66-1. 2021年3月9日にオリジナルからアーカイブ(PDF)されました。 2021年6月2日閲覧。
{{cite book}}: CS1 maint: location missing publisher (link) - ^ タギエフ、ロスタム (2011). Strategische Interaktion realer Agenten Ganzheitliche Konzeptualisierung und Softwarekomponenten einer interdisziplinären Forschungsinfrastruktur (新版)。ザールブリュッケン。ISBN 9783838125121。
{{cite book}}: CS1 maint: location missing publisher (link) - ^ “Zillions of Games - Who Are We?” www.zillions-of-games.com . 2017年11月15日時点のオリジナルよりアーカイブ。 2017年11月16日閲覧。
- ^ 「AiAiホームページ – Stephen Tavener」mrraow.com . 2015年9月6日時点のオリジナルよりアーカイブ。 2017年11月16日閲覧。
- ^ “Ai Ai announcement thread”. BoardGameGeek . 2017年11月16日時点のオリジナルよりアーカイブ。 2017年11月16日閲覧。
- ^ 「The PolyGamo Player Project | Programming Languages and General Players for Abstract Games and Puzzles」www.polyomino.com . 2002年9月23日時点のオリジナルよりアーカイブ。 2017年11月16日閲覧。
- ^ コワルスキー、ヤクブ;ミカ、マクシミリアン。ストヴィッチ、ヤクブ。シクワ、マレク (2019-07-17)。 「普通のボードゲーム」。人工知能に関する AAAI 会議の議事録。33 (1): 1699 ~ 1706 年。土井: 10.1609/aaai.v33i01.33011699。ISSN 2374-3468。S2CID 20296467。
- ^ コワルスキー、ヤクブ;ミルニク、ラドスロー。ミカ、マクシミリアン。パヴリク、ヴォイチェフ。ストヴィッチ、ヤクブ。シクラ、マレク。アンジェイ・トカチク(2020)。 「通常のボードゲームでの効率的な推理」。2020 IEEE ゲーム会議 (CoG)。ページ 455–462。arXiv : 2006.08295。土井:10.1109/cog47356.2020.9231668。ISBN 978-1-7281-4533-4. S2CID 219687404。
- ^ “Ludii Portal | Ludii General Game Systemのホームページ”. www.ludii.games . 2021年10月27日時点のオリジナルよりアーカイブ。 2021年10月27日閲覧。
- ^ 「デジタル・ルデム・プロジェクト | 伝統ゲームの進化のモデル化」www.ludeme.eu . 2021年10月2日時点のオリジナルよりアーカイブ。 2021年10月27日閲覧。
- ^ Piette, E.; Soemers, DJNJ; Stephenson, M.; Sironi, C.; Stephenson, M.; Winands MHM; Browne, C. (2020). 「Ludii – The Ludemic General Game System」(PDF) . European Conference on Artificial Intelligence (ECAI 2020), サンティアゴ・デ・コンペステーラ. 2022年1月21日時点のオリジナルよりアーカイブ(PDF) . 2021年10月27日閲覧。
- ^ Nielsen, Thorbjørn S.; Barros, Gabriella AB; Togelius, Julian; Nelson, Mark J. 「VGDLによるアーケードゲームルール生成に向けて」(PDF) 。 2015年9月12日時点のオリジナルよりアーカイブ(PDF) 。 2018年2月24日閲覧。
- ^ ab Levine, John; Congdon, Clare Bates; Ebner, Marc; Kendall, Graham; Lucas, Simon M.; Miikkulainen Risto, Schaul; Tom, Thompson; Tommy. 「一般的なビデオゲームのプレイ方法」(PDF) 。 2016年4月18日時点のオリジナルよりアーカイブ(PDF) 。 2016年4月9日閲覧。
- ^ Neufeld, Xenija; Mostaghim, Sanaz; Perez-Liebana, Diego. 「一般的なビデオゲームプレイのための回答セットプログラミングによる手続き型レベル生成」(PDF) 。 2016年3月28日時点のオリジナルよりアーカイブ(PDF) 。 2018年2月24日閲覧。
- ^ Świechowski, Maciej; Park, Hyunsoo; Mańdziuk, Jacek; Kim, Kyung-Joong (2015). 「一般的なゲームプレイにおける最近の進歩」. The Scientific World Journal . 2015 986262. Hindawi Publishing Corporation. doi : 10.1155/2015/986262 . PMC 4561326. PMID 26380375 .
- ^ ab 「一般的なゲームプレイのためのモンテカルロ木探索」ResearchGate . 2016年4月1日閲覧。
- ^ Finnsson, Hilmar (2012). 「一般ゲームプレイのための一般化モンテカルロ木探索拡張」第26回AAAI人工知能会議議事録. 2013年10月15日時点のオリジナルよりアーカイブ。 2016年4月9日閲覧。
- ^ Frydenberg, Frederik; Anderson, Kasper R.; Risi, Sebastian; Togelius, Julian. 「一般的なビデオゲームプレイにおけるMCTSの変更の調査」(PDF) 。 2016年4月12日時点のオリジナルよりアーカイブ(PDF) 。 2016年4月9日閲覧。
- ^ M. Swiechowski、J. Mandziuk、YS Ong、「UCTベースの汎用ゲームプレイプログラムのシングルプレイヤーゲームへの特化」、IEEE Transactions on Computational Intelligence and AI in Games、vol.PP、no.99、pp.1-1 doi :10.1109/TCIAIG.2015.2391232
- ^ 「前のゲームステップからルートノードを変更する」。2021年1月17日時点のオリジナルからアーカイブ。DBS
:有向幅優先探索(DBS)アルゴリズム
- ^ ab Perez, Diego; Dieskau, Jens; Hünermund, Martin. 「Open Loop Search for General Video Game Playing」(PDF) 。 2016年3月28日時点のオリジナルよりアーカイブ(PDF) 。 2016年4月9日閲覧。
- ^ ジェスパー・ユール著『ハーフリアル:現実のルールと架空の世界の間のビデオゲーム』MITプレス、2005年。
外部リンク
- スタンフォード大学のゲームプレイ全般に関するホームページ
- GGP.org、GGP.org GitHub ページ、games.stanford.edu も参照してください。
- ドレスデン工科大学が提供する一般的なゲームプレイ リソース。
- スティーブン・タヴェナー著『アイアイ』
- David M. Bennett による PolyGamo Player プロジェクト
- Axiom Development キットは、Greg Schmidt による、Zillions of Games と互換性のあるメタゲーム開発システムです。
- Palamedes - 汎用ゲームプレイIDE
- ConvNetJS ディープ Q ラーニング デモ
