AlphaStar(ソフトウェア)

AlphaStarは、 DeepMindがビデオゲーム「StarCraft II」をプレイするために開発した人工知能(AI)ソフトウェアです。2019年1月に名称が公表されました。AlphaStarは2019年8月に「グランドマスター」の地位を獲得し、当時の ビデオゲームにおけるAIの画期的な成果とみなされました。

背景

人間向けに作られたゲームは、人工知能の進歩のベンチマークとして外部妥当性を持つと考えられている。IBMのチェスエンジンDeep Blue(1997年)とDeepMindのAlphaGo(2016年)は主要なマイルストーンと見なされた。StarCraftも、その「リアルタイムプレイ、部分的な観測可能性、単一の支配的な戦略がないこと、複雑なルールのために高速フォワードモデルの構築が困難であること、そして特に大きく多様なアクションスペース」により、主要なマイルストーンになると主張する人もいる。[ 1 ] StarCraftは難しいものの、「ルールは既知であり、世界は少数の種類のオブジェクトのみで離散的である」ため、現在の技術ではまだ扱えるかもしれない。[ 2 ]

スタークラフトIIは、ブリザード・エンターテイメントが開発した人気の高いテンポの速いオンラインリアルタイム戦略ゲームです。[ 3 ] [ 4 ]

歴史

ディープマインド・テクノロジーズは2010年に英国で設立された。創業者のデミス・ハサビス氏は2011年の早い段階で、スタークラフトを囲碁などのゲームの後の「次のステップ」と呼んでいた。[ 5 ]ディープマインドは、様々なAtari 2600ゲームで超人的な能力を持つ自己学習ボットを実証した後、2014年にグーグルの子会社となった。2015年2月、コンピュータ科学者のザカリー・メイソン氏は、ディープマインドによる研究が「5年後か10年後にはスタークラフトにつながる」と予測した。[ 6 ] 2016年3月、AlphaGoが囲碁の世界チャンピオンであるイ・セドルに勝利した後、ハサビス氏はスタークラフト用のAI構築を公に検討し、スタークラフトは囲碁とは異なり「盤面」の大部分が見えない不完全情報戦略ゲームであると述べた。 [ 7 ] [ 8 ] 2016年11月のBlizzConで正式な提携が発表され、2017年第1四半期にボット向けのオープン開発環境をリリースする計画も発表された。[ 9 ]

2017年までに、DeepMindはStarCraftのデータを自社のソフトウェアに取り込む実験を始めていました。2017年8月、DeepMindとBlizzardはボット開発を支援する開発ツールと、65,000局の過去の対局データをリリースしました。当時、コンピューター科学者でStarCraftのトーナメントマネージャーであるDavid Churchillは、ボットが人間に勝つには5年かかると推定していましたが、AlphaGoが予想を上回ったことを付け加えました。Wiredのテクノロジージャーナリスト、Tom Simoniteは、「誰もロボットがすぐに勝つとは思っていません。しかし、もし勝てば、DeepMindが囲碁を制覇したという偉業をはるかに上回ることになるでしょう」と述べています。[ 10 ]

2018年12月、DeepMindのボットはプロプレイヤーのGrzegorz "MaNa" Kominczを5-0で破りました。DeepMindは2019年1月に「AlphaStar」と名付けられたこのボットを発表しました。Ars Technicaのジャーナリストをはじめとする人々は、AlphaStarには依然として不公平なアドバンテージがあると主張しました。「AlphaStarはAPIを用いて外科手術のような精度でクリック操作を行うことができますが、人間のプレイヤーはコンピューターマウスの機械的な限界に制約されています。」また、AlphaStarはゲーム内カメラに制限されることなく、グローバルな視野を持っていました。さらに、5秒間のウィンドウ内でのアクション数には上限がありましたが、AlphaStarは決定的な瞬間に超人的な爆発的なアクションを繰り出すために、ウィンドウ全体にアクション割り当てを不均等に割り当てることができました。DeepMindはすぐにAlphaStarをより現実的な制約下で再訓練しましたが、Kominnzとの再戦で敗北しました。[ 11 ] 2019年7月から、新しい制限付きバージョンのAlphaStarは、公開1対1のヨーロッパのマルチプレイヤーラダーに「参加」したプレイヤーと匿名で競い合いました。[ 12 ] 2019年8月末までに、AlphaStarはグランドマスターレベルに達し、人間のプレイヤーの上位0.2%にランクインしました。[ 13 ]

アルゴリズム

AlphaZeroとは異なり、AlphaStarはまず、人間対人間の対戦データベースから優秀なプレイヤーの動きを模倣することを学習します。このステップは、DeepMindのDave Silver氏が「探索問題」と呼ぶ問題を解決するために不可欠です。そうでなければ、新しい戦略を発見することは「干し草の山から針を探す」ようなものです。その後、エージェントは互いに対戦し、深層強化学習を展開します。これらのメインエージェントは、メインエージェントの弱点を暴くことを目的とする、最適ではない「エクスプロイターエージェント」との対戦を通じても学習します。[ 14 ] [ 15 ]

反応

2018年12月に5対0で敗れた後、コミンツは「AIがこれほど優れているとは思っていなかった」と述べた。[ 16 ]

スチュアート・ラッセルは、2018年のAlphaStarの勝利には「相当な問題固有の努力」が必要であり、汎用的な手法は「StarCraftにはまだ準備ができていなかった」と評価した。[ 2 ]

Wired UKの記事は、2019年7月の試合で導入されたAlphaStarの新しい制約が今回は「公平」であると評価した。[ 17 ]スタークラフトのプロプレイヤー、Raza "RazerBlader" Sekhaは、AlphaStarは「印象的」だが癖があり、ある試合では空中ユニットのみで構成された型破りな軍隊構成に屈したと述べた。英国のトッププレイヤー、Joshua "RiSky" Haywardは、AlphaStarは「最も効率的で戦略的な決定を下さないことが多かった」と述べ、いくらか失望感を表した。[ 14 ]プロのDiego "Kelazhur" Schwimerは、AlphaStarのプレイを「想像を絶するほど異例で、プロプレイヤーがStarCraftの多様な可能性をどれだけ探求してきたのか疑問に思わせる」と述べた。[ 13 ] AlphaStarの対戦相手は、自分がボットと対戦していることに気づかないことが多かった。[ 18 ]

ガーディアン紙のイアン・サンプル氏は、AlphaStarをAI分野における「画期的な成果」と呼んだ。[ 19 ]チャーチル氏は、これまでにもスタークラフトの1つか2つの要素をマスターしたボットは見たことがあるが、ゲーム全体を扱えるボットはAlphaStarが初めてだと述べた。[ 3 ]ゲイリー・マーカス氏はディープラーニングに対する懐疑的な見方を崩さず、「これまでこの分野では、このような技術を研究室やゲーム環境から現実世界に持ち込むのに苦労しており、今回の成果がその方向への進歩であるとは直ちには思えない」と述べた。[ 14 ] AI研究者のジョン・ドッジ氏はAlphaStarに驚き、「あと数年は」このような「超人的な」パフォーマンスは期待できないと述べた。一方、チャーチル氏は「スタークラフトは『解決』には程遠く、AlphaStarはまだ世界チャンピオンレベルのプレイにはほど遠い」と述べている。[ 4 ]

遺産

DeepMindは、AlphaStarから得られる知見は、ロボット、自動運転車、バーチャルアシスタントといった「不完全な観測情報」に基づいて動作する必要がある分野に役立つ可能性があると主張している。シルバー氏は、自身の研究室はAlphaStarの大幅な改良に取り組むのではなく、「現時点では休止するかもしれない」と示唆している。[ 14 ]シルバー氏自身は、「AlphaStarは、プロが承認した条件下で、制限のない完全なゲームにおいて、プロがプレイするeスポーツにおいて人間のパフォーマンスの最高レベルに到達した最初のAIシステムとなった…コンピューターが囲碁、チェス、ポーカーを解読して以来、StarCraftは、基本的にコミュニティの合意によって、AIにとっての次なる大きな挑戦として浮上してきた」と主張している。[ 19 ]

コンピュータ科学者のノエル・シャーキーは、「軍事アナリストは、AIが戦場計画にもたらす利点の明確な例として、成功したアルファスターリアルタイム戦略に注目するだろう」と批判的に主張している。[ 19 ]一方、シルバーは「これが軍事的に何らかの用途を持つと言うことは、チェス用のAIが軍事用途につながる可能性があると言うのと同じだ」と反論している。[ 14 ]

参照

参考文献

  1. ^アルルクマラン, カイ; アントワーヌ, カリー; トゲリウス, ジュリアン (2019年7月). 「AlphaStar: 進化計算の視点」.遺伝的・進化的計算カンファレンスコンパニオンの議事録. pp.  314–5 . arXiv : 1902.01724 . doi : 10.1145/3319619.3321894 . ISBN 9781450367486. S2CID  59604439 .
  2. ^ a bラッセル、スチュアート(2019年10月8日)「第2章 人間と機械の知能」『Human Compatible: Artificial Intelligence and the Problem of Control』(ハードカバー版)ヴァイキング社ISBN 978-0-525-55861-3
  3. ^ a b Daley, Jason (2019年10月30日). 「AIがバックギャモン、チェス、囲碁を制覇。今度はスタークラフトIIに挑戦」 .スミソニアン・マガジン. 2020年2月26日閲覧
  4. ^ a b Garisto, Dan (2019年10月30日). 「Google AI 、戦略ゲーム「StarCraft II」で人間のトッププレイヤーに勝利」. Nature . doi : 10.1038/d41586-019-03298-6 . PMID 33116320. S2CID 208116679 .  
  5. ^チェン、ジョナサン(2016年4月22日)「ゲームで人間を圧倒するコンピューターは、その敵に出会ったかもしれない:『スタークラフト』」ウォール・ストリート・ジャーナル」2020年2月26日閲覧
  6. ^ギブス、サミュエル(2014年1月27日)「Google、英国の人工知能スタートアップDeepmindを4億ポンドで買収」ガーディアン紙2020年2月26日閲覧
  7. ^ Byford, Sam (2016年3月10日). 「DeepMind創業者デミス・ハサビス氏、AIが未来を形作る方法について語る」 The Verge . 2020年2月26日閲覧
  8. ^ 「Googleの人工知能プロジェクト、ビデオゲームのプレイを開始する可能性」 Fortune誌。 2020年2月26日閲覧
  9. ^ Byford, Sam (2016年11月4日). 「Google DeepMindの次なるゲームへの挑戦:AIはStarCraft IIに勝てるか?」 The Verge . 2020年2月26日閲覧
  10. ^ 「Google DeepMindのAIがStarCraftに銀河戦争を宣言」 Wired 2017年8月9日。 2020年2月26日閲覧
  11. ^ Lee, Timothy B. (2019年1月30日). 「AIがStarCraftで2人のプロゲーマーを圧倒したが、フェアな戦いではなかった」 . Ars Technica . 2020年2月26日閲覧
  12. ^ Amadeo, Ron (2019年7月11日). 「DeepMindのAIはStarCraft IIの1v1ラダーにひそかに潜んでいる」 . Ars Technica . 2020年2月26日閲覧
  13. ^ a b Statt, Nick (2019年10月30日). 「DeepMindのStarCraft 2 AIは、現在、全人間プレイヤーの99.8%よりも優れている」 The Verge . 2020年2月26日閲覧
  14. ^ a b c d e Kelion, Leo (2019年10月30日). 「DeepMind、eスポーツにおけるAIの画期的な瞬間を宣言」 . BBCニュース. 2020年2月26日閲覧
  15. ^ Vinyals, Oriol; Babuschkin, Igor; Czarnecki, Wojciech M.; et al. (2019年10月30日). 「マルチエージェント強化学習を用いたStarCraft IIのグランドマスターレベル」. Nature . 575 ( 7782): 350– 354. Bibcode : 2019Natur.575..350V . doi : 10.1038/s41586-019-1724-z . PMID 31666705. S2CID 204972004 .  
  16. ^ヘブン・ダグラス(2019年8月21日)「マインドメルド:人工知能は人間の思考を改善する」ニューサイエンティスト誌。 2020年2月26日閲覧
  17. ^ Lee, Alex (2019年10月30日). 「DeepMindがついにStarCraftで人間を圧倒」 . Wired UK . 2020年2月26日閲覧
  18. ^ 「DeepMind、AIがStarCraft IIゲームを制覇、画期的な成果を主張」フィナンシャル・タイムズ、2019年。 2020年2月26日閲覧
  19. ^ a b cイアン・サンプル (2019年10月30日). 「AIが『悪魔のように複雑な』『スタークラフトII』のグランドマスターに」 .ガーディアン. 2020年2月26日閲覧