
計算的創造性(人工創造性、機械的創造性、創造的コンピューティング、創造的計算とも呼ばれる)は、人工知能、認知心理学、哲学、芸術(例えば、計算文化の一部である計算芸術[ 1 ])の分野の交差点に位置する学際的な取り組みです。
人間のような創造プロセスをエミュレートするためにコンピュータ システムを応用し、革新性と独創性を模倣した芸術的およびデザイン的出力の生成を促進します。
計算的創造性の目標は、コンピュータを使用して創造性をモデル化、シミュレート、または複製し、いくつかの目的の1つを達成することです。[ 2 ]
計算創造性の分野は、創造性の研究における理論的および実践的な問題を扱っています。創造性の本質と適切な定義に関する理論的研究は、創造性を発揮するシステムの実装に関する実践的研究と並行して行われ、一方の研究が他方の研究に影響を与えています。
計算による創造性の応用形は、メディア合成として知られています。
理論的アプローチは創造性の本質に関わる。特に、卓越した創造性が規則の破りや慣習の否定に繋がるのであれば、どのような状況下でモデルを「創造的」と呼ぶことができるのかという問題である。これは、エイダ・ラブレスが機械知能に反論した意見の派生であり、テレサ・アマビレ[ 3 ]といった現代の理論家によっても要約されている。もし機械がプログラムされたことしかできないのであれば、その行動は一体どのようにして創造的と言えるのだろうか。
実際、すべてのコンピュータ理論家が、コンピュータはプログラムされたことしかできないという前提に同意するわけではない[ 4 ]。これは計算の創造性を支持する重要なポイントである。
創造性の全体像を示す単一の視点や定義は存在しないと思われるため、AI研究者のニューウェル、ショー、サイモン[ 5 ]は、新規性と有用性の組み合わせを創造性の多面的な見方の基礎として開発し、次の4つの基準を使用して特定の回答や解決策を創造的であると分類します。
マーガレット・ボーデンは、これらの基準の最初の2つに焦点を当て、創造性(少なくともコンピュータが創造的であるかどうかを問う場合)は「新しく、驚くべき、価値のあるアイデアや成果物を思いつく能力」と定義されるべきだと主張した。[ 6 ]
ミハイ・チクセントミハイは創造性は社会的な文脈で考えなければならないと主張し、彼のDIFI(領域-個人-場相互作用)の枠組みはそれ以来この分野に大きな影響を与えてきた。[ 7 ] DIFIでは、個人が制作した作品の斬新さと価値は場(社会の他の人々)によって評価され、フィードバックが与えられ、最終的に創造的であるとみなされた作品は社会的な作品の領域に加えられ、個人はその後影響を受ける可能性がある。
上記は計算的創造性に対するトップダウン型のアプローチを反映しているが、人工ニューラルネットワーク研究に携わるボトムアップ型の計算心理学者の間では、別の流れが生まれている。例えば1980年代後半から1990年代初頭にかけて、このような生成ニューラルシステムは遺伝的アルゴリズムによって駆動されていた[ 8 ]。リカレントネットワークを用いた実験[ 9 ]は、単純な音楽メロディーのハイブリッド化とリスナーの期待の予測に成功した。
創造的な成果物を生み出すための計算プロセスの利用は、歴史の古来から存在していました。1800年代後半には、モーツァルト、バッハ、ハイドン、キルンベルガーといった著名な作曲家たちが、組み合わせ的に音楽を作曲する方法を探求しました。[ 10 ]このアプローチは1934年には分析的な試みにも広がり、数学的な問題解決を探求するために、単純な機械モデルが構築されました。[ 11 ]計算の創造的な側面に対する専門家の関心は、人工知能の初期の議論でも広く取り上げられました。1956年のダートマス会議では、創造性、発明、発見が人工知能の主要目標として挙げられました。[ 12 ]
コンピュータの発達により、より複雑なシステムが可能になり、1970年代と1980年代には、記号的アプローチやルールベースのアプローチを用いて創造性をモデル化する初期のシステムが発明されました。創造的なストーリーテリングの分野では、このようなモデルがいくつか研究されました。ミーハンのTALE-SPIN(1977)は、登場人物の目標と決定木のシミュレーションを通じて物語を生成しました。デーンのAUTHOR(1981)は、作家の物語創作プロセスをシミュレーションすることで生成にアプローチしました。[ 13 ]物語生成を超えて、計算による創造性は芸術的および科学的領域にも広がりました。
芸術的な画像生成は、計算による創造性を通じた生成作品の可能性を早期に見出した分野の一つでした。最も顕著な例の一つは、ハロルド・コーエンのAARONです。AARONは、視覚構成のための膨大な記号規則とヒューリスティックに基づいて、図形の構成と適応を通して芸術作品を生み出しました。また、科学研究における創造性にも取り組んだシステムもありました。BACONは、制約された空間における仮説検定を通じて、ボイルの法則やケプラーの法則といった自然法則を再発見したと言われています。
1990年代までに、モデリング技術はより適応的になり、生成のための認知的創造ルールの実装が試みられました。ターナーのMINSTREL(1993)は、生成的ストーリーテリングにおける既存資料の創造的再利用をシミュレートするTRAM(Transform Recall Adapt Methods)を導入しました。一方、ペレス・イ・ペレスのMEXICA(1999)は、関与と内省のサイクルを用いて創作プロセスをモデル化しました。システムが内的評価モデルをますます取り入れるようになるにつれて、記号的生成とドメイン固有の評価指標を組み合わせ、創造性への生成的および選択的なステップをモデル化する新たなアプローチが登場しました。
世代的ユーモアの分野では、JAPEシステム(1994)がPrologとWordNetを使用して、記号パターンマッチングルールと大規模な語彙データベース(WordNet)を適用して、言葉遊びを含むなぞなぞを作成し、しゃれベースのなぞなぞを生成しました。[ 14 ] WordNetは、プリンストン大学のジョージ・ミラーと彼のチームによって開発されたシステムであり、そのプラットフォームとインスピレーションを受けた単語マッピング構造は、いくつかの統語的および意味的AIプログラムのバックボーンとして使用されています。音楽生成の注目すべきシステムは、デビッド・コープのEMI(音楽知能実験)またはエミーで、バッハ、ベートーベン、ショパンなどのアーティストのスタイルでトレーニングされ、パターンの抽象化と再構成を通じて彼らのスタイルで新しい曲を生成しました。
2000年代以降、機械学習は創造的システムの設計に影響を与え始めました。ミハルセアやストラパラヴァといった研究者は、文体的特徴と意味的特徴を用いて、ユーモラスなテキストとそうでないテキストを区別する分類器を訓練しました。一方、カスタム計算手法の導入により、Deep Blueのようなチェスシステムは、特定のルールと評価パターンに制約された探索アルゴリズムと並列処理を通じて、準創造的なゲームプレイ戦略を生成するようになりました。[ 15 ]
計算創造性の組織的発展は、その技術進歩とともに発展しました。1990年代には、AIと創造性に焦点を当てた学際的な会議から発展し、IJWCCのような専門ワークショップが登場しました。2000年代初頭には、この分野は国際計算創造性会議(ICCC)のような年次会議を中心に発展しました。[ 16 ]近年、ディープラーニング、トランスフォーマー、そして機械学習構造のさらなる改良により、計算創造性の実装空間には新たな開発ツールが生まれています。

photograph of an astronaut riding a horse on moon創造性に対する従来の計算論的アプローチは、開発者による処方箋の明示的な定式化とコンピュータプログラムにおけるある程度のランダム性に依存していたが、機械学習の手法では、コンピュータプログラムが入力データからヒューリスティックを学習し、コンピュータプログラム内で創造力を発揮することができる。[ 17 ]特に、ディープニューラルネットワークは入力データからパターンを学習し、創造的な成果物を非線形に生成することを可能にする。1989年より前、人工ニューラルネットワークは創造性の特定の側面をモデル化するために使用されていた。ピーター・トッド(1989)は、最初にニューラルネットワークをトレーニングし、楽曲のトレーニングセットから音楽のメロディーを再生させた。次に、変更アルゴリズムを使用してネットワークの入力パラメータを変更した。ネットワークは、非常に制御されていない方法でランダムに新しい音楽を生成することができた。[ 9 ] [ 18 ] [ 19 ] 1992年にトッド[ 20 ]はこの研究を拡張し、ポール・マンロー[ 21 ] 、ポール・ワーボス[ 22 ]、D・グエンとバーナード・ウィドロウ[ 23 ] 、マイケル・I・ジョーダンとデイヴィッド・ルメルハート[ 24 ]によって開発された、いわゆる遠隔教師アプローチを採用した。この新しいアプローチでは、2つのニューラルネットワークがあり、そのうちの1つがもう1つのニューラルネットワークにトレーニングパターンを提供する。トッドの後の研究では、作曲家はメロディー空間を定義するメロディーのセットを選択し、マウスベースのグラフィックインターフェースを使用して2次元平面上に配置して、コネクショニストネットワークにそれらのメロディーを生成するようにトレーニングし、2次元平面の中間点に対応してネットワークが生成する新しい「補間」メロディーを聴くことができる。
GPTやLSTMのような言語モデルは、小説や脚本などの創作目的のテキスト生成に用いられます。これらのモデルは時折幻覚を示し、誤った資料を事実であるかのように提示することがあります。クリエイターは幻覚的傾向を利用して、意図しない結果を捉えます。例えば、ロス・グッドウィンの『路上』は、文学コーパスで学習させたLSTMモデルを用いて、ジャック・ケルアックの『路上』を引用した小説を生成します。これは、ロードトリップ中にカメラ、マイク、ノートパソコンの内蔵時計、GPSによって記録されたマルチモーダル入力に基づいています。[ 25 ] [ 26 ]ブライアン・マーチャントはこの小説を「現代アメリカのイメージを寄せ集めたピクセル化された詩」と評しました。[ 26 ]オスカー・シャープとロス・グッドウィンは2016年に実験的なSF短編映画「サンスプリング」を制作した。この映画はLSTMモデルを使って書かれ、彼らの脚本と1980~1990年のSF映画で学習された。[ 25 ] [ 27 ]ロディカ・ゴッカは彼らの物語と人間の文化の背景に基づいた創作意図に全体的に焦点が欠けていると批判した。[ 25 ]
しかしながら、研究者たちは、応答の正確性と一貫性を制御できることから、言語モデルの幻覚が新しい解決策を生み出すという肯定的な側面を強調しています。Jiangらは、幻覚効果を活用するための発散収束フローモデルを提案しています。彼らは、現在の研究における幻覚効果の種類を事実性幻覚と忠実性幻覚にまとめ、さらに事実の捏造や指示の不一致といったより細かいクラスに分類できるとしています。発散段階では幻覚の可能性のあるコンテンツが生成されますが、収束段階では、意図認識と評価指標を用いて、ユーザーにとって有用な幻覚をフィルタリングすることに重点が置かれています。[ 28 ]
いくつかの高レベルかつ哲学的なテーマは、計算創造性の分野全体で繰り返し登場します。たとえば、次のようになります。
マーガレット・ボーデン[ 6 ] [ 29 ]は、それを生み出す主体にとってのみ新しい創造性を「P創造性」(心理的創造性)と呼び、社会全体で新しいと認識される創造性を「H創造性」(歴史的創造性)と呼んでいます。
ボーデンはまた、確立された概念空間内での探究から生じる創造性と、この空間の意図的な変容または超越から生じる創造性を区別している。彼女は前者を探索的創造性、後者を変容的創造性と名付け、後者は前者よりもはるかに急進的で挑戦的で稀有な創造性の一形態であると考えている。上で詳述したニューウェルとサイモンの基準に従えば、どちらの形態の創造性も明らかに斬新で有用な結果を生み出すはずである(基準 1)が、探索的創造性は十分に理解された空間の徹底的かつ粘り強い探索から生じる可能性が高く(基準 3)、変容的創造性は、この空間を定義する制約の一部(基準 2)または問題自体を定義する前提の一部(基準 4)を拒否することを伴うはずであることがわかる。ボーデンの洞察は、計算論的創造性の研究を非常に一般的なレベルで導き、アルゴリズムの内容の技術的フレームワークというよりも、開発作業のためのインスピレーションを与える試金石となっている。しかし、ボーデンの洞察は形式化の対象にもなっており、特にゲラント・ウィギンズの著作で顕著である。[ 30 ]
創造的な成果物は斬新で有用でなければならないという基準は、創造的な計算システムが典型的には生成と評価の2つの段階に構造化されることを意味する。第一段階では、(システム自身にとって斬新な、つまりP-Creativeな)構成が生成される。システムが既に知っている独創性のない構成は、この段階で除外される。この潜在的に創造的な構成の集合は、どれが有意義で有用で、どれがそうでないかを判断するために評価される。この2段階構造は、フィンケ、ウォード、スミスによるGeneploreモデル[ 31 ]に準拠している。これは、人間の創造性に関する経験的観察に基づいた創造的生成の心理学的モデルである。
ジョーダヌスとケラーは、「扱いやすく明確に表現された創造性モデル」の必要性を強調しています。彼らは、60年にわたる心理学と創造性研究の実証研究コーパスから694語の創造性関連語を抽出し、語彙の類似性に基づいてクラスタリングしました。その結果、彼らは創造性の14の主要構成要素を特定し、「創造システム評価のための標準化手順」(SPECS)という枠組みの基礎を形成しました。これらの構成要素には、「不確実性への対処」、「独立性と自由」、「社会的相互作用とコミュニケーション」、「自発性と潜在意識の処理」といった側面が含まれています。[ 32 ]
計算的創造性研究の多くは、機械による独立的かつ自動的な創造性生成に焦点を当てていますが、多くの研究者は協働的なアプローチに傾倒しています。[ 33 ]この人間とコンピュータの相互作用は、創造性支援ツール開発に分類されることがあります。これらのシステムは、研究、統合、意思決定、そしてアイデア創出のための理想的な枠組みを提供することを目指しています。[ 34 ] [ 35 ]最近では、画像、音声、自然言語処理への深層学習アプローチにより、生産的な創造性開発フレームワークのモデル化が進んでいます。[ 36 ] [ 37 ]
計算的創造性は、イノベーションとマネジメントの文献でますます議論されるようになってきている。これは、AIの最近の発展がイノベーションのプロセス全体を混乱させ、イノベーションの創出方法を根本的に変える可能性があるからである。[ 38 ] [ 36 ]フィリップ・ハッチンソン[ 33 ]は、イノベーションの創出における計算的創造性の関連性を強調し、「自己革新型人工知能」(SAI)という概念を提示し、企業がイノベーションのプロセスでAIを活用して革新的な製品やサービスを強化する方法を説明し始めた。SAIは、複数のデータソースを継続的に組み合わせて分析することから得られる洞察に基づいて、既存製品または開発中の新製品を段階的に進化させることを目的とした、AIの組織的活用と定義される。AIが汎用技術になるにつれて、SAIで開発される製品の範囲は、単純なものからますます複雑なものへと広がるだろう。これは、計算的創造性が人間の創造性関連スキルの転換につながることを示唆している。
ヴィールとペレス・イ・ペレスは、ジョラらが提唱した「最適イノベーション」が、計算的創造性を育むための有用な基盤であると考えている。[ 39 ]ジョラらの実験では、参加者に言語刺激(例:体と魂 vs. 体と足裏)と非言語刺激(例:平和の鳩 vs. 手を振っているように見える垂直のポーズの平和の鳩)の快感と親しみやすさの評価を依頼した。この実験は、快感を与える刺激は、文字形式の顕著な意味を維持しながら革新的である必要があることを示している。ヴィールとペレス・イ・ペレスは、形式の変化によって意味がどのように変化するかを捉える計算システムの開発の必要性を強調している。[ 40 ]
人間の創造性の多くは、おそらくすべては、既存のアイデアや物体の斬新な組み合わせとして理解することができます。[ 41 ]組み合わせ的創造性のための一般的な戦略には以下が含まれます。
組み合わせ論的視点から見ると、創造性は可能な組み合わせ空間を探索するプロセスとしてモデル化できます。組み合わせは、異なる表現の合成や連結、あるいは初期表現と中間表現のルールベースまたは確率的変換によって生じます。遺伝的アルゴリズムとニューラルネットワークは、異なる入力の組み合わせを捉える混合表現や交差表現を生成するために使用できます。
マーク・ターナーとジル・フォコニエ[ 42 ] [ 43 ]は、アーサー・ケストラーの創造性に関する考え[ 44 ]とレイコフとジョンソン[ 45 ]の研究を、認知言語学研究の考え方を精神空間と概念メタファーに統合することで発展させた概念統合ネットワークと呼ばれるモデルを提唱している。彼らの基本モデルでは、統合ネットワークを4つの連結された空間として定義している。
フォコニエとターナーは、整形式の統合ネットワークの構築を導くとされる一連の最適性原理を説明しています。本質的に、彼らはブレンディングを、2つ以上の入力構造を単一のブレンド構造に圧縮する圧縮メカニズムと捉えています。この圧縮は概念関係のレベルで作用します。例えば、入力空間間の一連の類似関係は、ブレンドにおいて単一の同一関係に圧縮されます。
接続された意味構造を重視することで互換性のある類推マッピングの既存の計算モデルを拡張することにより、ブレンディングモデルでいくつかの計算上の成功が達成されました。[ 46 ] 2006年に、フランシスコ・カマラ・ペレイラ[ 47 ]は、シンボリックAIと遺伝的アルゴリズムの両方のアイデアを採用してブレンディング理論のいくつかの側面を実用的な形で実現するブレンディング理論の実装を発表しました。彼の例の領域は言語から視覚にまで及び、後者で最も顕著なものには、3Dグラフィカルモデルを組み合わせて神話上のモンスターを作成することが含まれます。
言語は創造性を発揮する絶え間ない機会を提供しており、それは新しい文章、言い回し、しゃれ、新語、押韻、暗示、皮肉、アイロニー、直喩、隠喩、類推、機知、ジョークの生成に表れている。[ 48 ]形態論的に豊かな言語のネイティブスピーカーは、理解しやすい新しい語形を頻繁に作り出し、そのいくつかは辞書に載っている。[ 49 ]自然言語生成の分野は十分に研究されてきたが、日常言語のこうした創造的な側面は、いまだに堅牢性や規模をもって組み込まれていない。
応用言語学者ロナルド・カーターは、その独創的な研究で、言葉と言葉のパターンに関わる創造性の2つの主要なタイプ、すなわちパターン改革型創造性とパターン形成型創造性という仮説を立てました。[ 48 ]パターン改革型創造性とは、ルールを破り、個人の革新を通じて言語のパターンを改革し、再形成することによる創造性を指します。一方、パターン形成型創造性とは、言語のルールを破るのではなく、ルールに準拠することによる創造性を指し、反復という形での相互作用を通じて、対話者間の収束、対称性、およびより大きな相互性を生み出します。[ 50 ]
1970年代以降、ジェームズ・ミーハンのTALE-SPIN [ 51 ]システムが開発され、この言語創造の分野では多大な研究が行われてきました 。TALE-SPINは、物語を問題解決の努力の物語的記述とみなし、最初に物語の登場人物に目標を設定し、解決策の探求を追跡して記録することで物語を作成しました。MINSTREL [ 52 ]システムは、この基本的なアプローチを複雑に発展させたもので、物語の登場人物レベルの目標と作者レベルの目標を区別しています。ブリングスヨードのBRUTUS [ 53 ]などのシステムは、これらのアイデアをさらに発展させ、裏切りなどの複雑な人間関係のテーマを持つ物語を作成します。それでも、MINSTRELは、古いシーンから新しいシーンを作成するために、一連の変換、想起、適応法(TRAM)を使用して創造プロセスを明示的にモデル化しています。ラファエル・ペレス・イ・ペレスとマイク・シャープルズによるMEXICA [ 54 ]モデルは、物語を語るという創造的なプロセスに特に興味を持っており、創造的な執筆の関与-反映認知モデルの一種を実装しています。
比喩の例: 「彼女は猿だった。」
直喩の例:「虎の毛皮の毛布のような感触だった」。これらの現象の計算論的研究は、主に知識ベースのプロセスとしての解釈に焦点を当ててきました。ヨリック・ウィルクス、ジェームズ・マーティン[ 55 ] 、ダン・ファス、ジョン・バーンデン[ 56 ]、マーク・リーといった計算論者は、言語レベルまたは論理レベルにおいて、メタファーの処理に対する知識ベースのアプローチを開発してきました。トニー・ヴィールとヤンフェン・ハオは、Sardonicusと呼ばれるシステムを開発しました。このシステムは、Webから明示的な直喩の包括的なデータベースを取得します。これらの直喩は、真正なもの(例:「鋼鉄のように硬い」)または皮肉なもの(例:「ボウリングのボールのように毛深い」、「根管のように心地よい」)としてタグ付けされます。どちらのタイプの直喩も、任意の形容詞に対してオンデマンドで取得できます。彼らはこれらの直喩を、与えられた記述目標に対して語彙メタファーを提案できるアリストテレス[ 57 ]と呼ばれるオンラインメタファー生成システムの基礎として使用している(例えば、スーパーモデルを痩せていると記述する場合、「鉛筆」、「鞭」、「ホイペット」、「ロープ」、「ナナフシ」、「ヘビ」といったソース用語が提案される)。
類推的推論のプロセスは、マッピングと検索の両方の観点から研究されており、検索は新しい類推を生成する鍵となる。デドレ・ゲントナーが提唱した主流派の研究は、類推を構造保存プロセスとみなし、この見方は構造マッピングエンジンまたはSME [ 58 ] 、 MAC/FAC検索エンジン(Many Are Called, Few Are Chosen)、ACME(類推制約マッピングエンジン)、およびARCS(類推検索制約システム)に実装されている。他のマッピングベースのアプローチにはSapper [ 46 ]があり、これはマッピングプロセスを記憶の意味ネットワークモデルに位置付けている。類推は創造的計算と創造的認知の非常に活発なサブエリアであり、このサブエリアで活躍している人物にはダグラス・ホフスタッター、ポール・サガード、キース・ホリオークなどがいる。また、ここで注目に値するのは、SATスタイルの類推問題を解くためのPeter Turney 氏と Michael Littman 氏による機械学習のアプローチです。彼らのアプローチは、これらのテストで人間が獲得した平均スコアに匹敵するスコアを達成しました。
ユーモアは特に知識を必要とするプロセスであり、これまでで最も成功したジョーク生成システムは、キム・ビンステッドとグレアム・リッチーの研究に代表されるように、しゃれの生成に焦点を当ててきた。[ 59 ]この研究には、幼児が常に斬新で面白いと評価する幅広いしゃれを生成できるJAPEシステムが含まれる。 JAPEの改良版は、STANDUPシステムを装って開発され、コミュニケーション障害のある子供たちとの言語的相互作用を強化する手段として実験的に展開されてきた。 代名詞参照の意図的な誤解(ハンス・ウィム・ティンホルトとアントン・ナイホルトの研究)など、自然言語の他の側面を伴うユーモアの生成や、オリビエロ・ストックとカルロ・ストラパラバのHAHAcronymシステム[ 60 ]におけるユーモラスな頭字語の生成においても、限定的な進歩が遂げられている。
言語における新語創造の支配的な要因は、複数の語形の融合です。これらの新語は、一般的に「ブレンド」または「ポートマントー語」(ルイス・キャロルにちなんで)と呼ばれます。トニー・ヴィールは、ZeitGeist [ 61 ]と呼ばれるシステムを開発しました。このシステムは、 Wikipediaから新語の見出し語を収集し、Wikipedia内のローカルコンテキストとWordNetの特定の語義に基づいて解釈します。ZeitGeistは、独自の新語生成にも拡張されています。このアプローチは、WordNetから収集された単語の構成要素のインベントリの要素を組み合わせ、同時にこれらの新語の適切な用語(例えば、「gastronaut」は「food traveller」、「chrononaut 」は「time traveller」)を決定します。次に、 Web検索を用いて、どの用語が意味を持ち、どの新語がこれまで使われていないかを判断します。この検索によって、生成された単語のうち、新規(「H-creative」)かつ有用な単語のサブセットが特定されます。
新語の探索と抽出のためのコーパス言語学的アプローチも可能であることが示されています。ロッキー・ローは、現代アメリカ英語コーパスを参考コーパスとして用い、アメリカのテレビドラマ『ハウスMD』の脚本に登場するハパックス・レゴメナを用いて、新語、混成語、俗語の抽出を行いました[ 62 ]。
新語に関する言語学的研究において、ステファン・Th・グリースは英語の混合構造の定量分析を行い、「混合語の形成において、原語の認識度と、混合語に対する原語の類似性が重要な役割を果たしている」ことを明らかにした。この結果は、意図的な混合語と発話エラーによる混合語の比較によって検証された。[ 63 ]
鉄よりも、鉛よりも、金よりも、私には電気が必要です。羊肉や豚肉、レタスやキュウリよりも、私には電気が必要です。私の夢のために必要なのです。
ジョークと同様、詩も様々な制約が複雑に絡み合っていて、汎用的な詩生成器では詩の意味、言い回し、構造、押韻といった要素を適切に組み合わせることはできない。しかし、パブロ・ジェルバス[ 64 ]は事例ベース推論(CBR)アプローチを採用し、既存の詩の事例ベースから取得した詩の断片を組み合わせて、与えられた入力テキストの詩的な構成を生成するASPERAという注目すべきシステムを開発した。ASPERA事例ベースの各詩の断片には、その断片の意味を表す散文文字列が注釈として付けられており、この散文文字列が各断片の検索キーとして使用される。その後、韻律規則を使用してこれらの断片を適切な詩的構造に結合する。Racterはこうしたソフトウェアプロジェクトの一例である。LLMは2010年代後半から詩に適用されている。 2020年秋、The Poetry Review(ISSN 0032-2156)は、アリエル・クラインの「50% Human: A poetic interview with AI agents」を掲載しました。これはLLMが生成/支援した詩の特集であり、主要な文芸雑誌に掲載されたLLMの詩の初期の検証済み事例でした。[ 65 ] [ 66 ]その後、K・アラド・マクダウェルのPharmako-AI(2020年)やI Am Code: An Artificial Intelligence Speaks: Poems (2023年)などの業界出版物により、LLMが執筆した詩がより広い聴衆に届けられました。[ 67 ] [ 68 ]
音楽分野における計算的創造性は、人間の音楽家が使用する楽譜の生成と、コンピュータによる演奏のための音楽の生成の両方に焦点を当ててきました。生成領域には、クラシック音楽(モーツァルトやバッハ風の音楽を生成するソフトウェアを使用)やジャズが含まれています。[ 69 ]最も注目すべきは、デビッド・コープ[ 70 ]が「Experiments in Musical Intelligence」(EMI) [ 71 ]と呼ばれるソフトウェアシステムを開発したことです。これは、人間の作曲家による既存の音楽を分析・一般化し、同じスタイルの新しい楽曲を生成することができます。EMIの出力は、人間の聴衆にその音楽が高度な能力で人間によって生成されたものだと納得させるほどの説得力を持っています。[ 72 ]
現代クラシック音楽の分野において、Iamusはゼロから作曲を行い、プロの演奏家が演奏できる最終楽譜を作成する初のコンピュータです。ロンドン交響楽団は、 IamusのデビューCDに収録されているフルオーケストラ作品を演奏しました。[ 73 ]このCDは、ニューサイエンティスト誌で「コンピュータによって作曲され、フルオーケストラによって演奏された最初の大作」と評されています。[ 74 ] Iamusを支える技術であるMelomicsは、様々な音楽スタイルの楽曲を同等の品質で生成することができます。
ジャズにおける創造性研究は、即興演奏のプロセスと、それが音楽エージェントに課す認知的要求、すなわち時間についての推論、すでに演奏されたものの記憶と概念化、次に演奏される可能性のあるものの事前の計画に焦点を当ててきた。[ 75 ] ジョージア工科大学のギル・ワインバーグが開発したロボット「シモン」は、ジャズの即興演奏を披露した。[ 76 ]ジェラルド・アサヤグとシュロモ・ドゥブノフによる様式モデリングの研究に基づく仮想即興ソフトウェアには、OMax、SoMax、PyOracleなどがあり、ライブ演奏者からその場で学習した可変長のシーケンスを再注入することで、リアルタイムで即興演奏を作成するのに使用されている。[ 77 ]
音楽作曲の分野では、ルネ=ルイ・バロンの特許作品[ 78 ]により、あらゆる音楽スタイルにおいて、いわゆる「コヒーレント」な、多数のオーケストレーションされたメロディーを作曲・演奏できるロボットの開発が可能になった。特定の音楽パラメータに関連付けられたあらゆる物理的パラメータは、これらの楽曲に影響を与え、発展させることができる(楽曲を聴いている間、リアルタイムで)。特許発明であるメダル・コンポーザーは、著作権上の問題を提起している。
視覚芸術の生成における計算的創造性は、抽象芸術と具象芸術の両方の創造において、注目すべき成功を収めてきました。この分野でよく知られているプログラムは、ハロルド・コーエンのAARON [ 79 ]で、1973年以来継続的に開発・拡張されてきました。Aaronは定型的なプログラムでありながら、多様な出力を提供し、人物(ダンサーなど)、鉢植え、岩、その他の背景イメージ要素を組み込んだ白黒のドローイングやカラーの絵画を生成します。これらの画像は、評判の高いギャラリーで展示されるほどの高品質です。
注目すべきソフトウェアアーティストとしては、ペヌサル・マチャドによるNEvArシステム(「Neuro-Evolutionary Art」の略)が挙げられます。[ 80 ] NEvArは遺伝的アルゴリズムを用いて数学関数を導き出し、それを用いて色付きの3次元表面を生成します。ユーザーは遺伝的アルゴリズムの各フェーズの後に最良の画像を選択することができ、これらの好みは後続のフェーズの指針として用いられます。これにより、NEvArの探索は、ユーザーにとって最も魅力的と思われる探索空間の領域へと押し進められます。
Simon Coltonが開発したPainting Foolは、さまざまなペイント スタイル、カラー パレット、ブラシ タイプを選択して、特定のシーンのデジタル画像にオーバーペイントするシステムとして始まりました。操作に入力ソース画像に依存することから、Painting Fool の初期のバージョンでは、計算アートシステムにおける創造性の範囲、あるいは創造性の欠如について疑問が生じました。しかし、 Painting Fool は、 AARONと同様に、その限られた想像力から斬新な画像を作成できるように拡張されました。このような画像には都市の風景や森林があり、ユーザーが提供するいくつかの基本シナリオから制約充足プロセスによって生成されます(たとえば、これらのシナリオにより、システムは表示面に近いオブジェクトはより大きく彩度が高く、遠くにあるオブジェクトは彩度が低く小さく見えると推論できます)。芸術的には、現在 Painting Fool によって作成された画像は Aaron によって作成された画像と同等であるように見えますが、前者が採用している拡張可能なメカニズム (制約の充足など) により、より精巧で洗練された画家に進化する可能性があります。
アーティストのクラシ・ディムチ(クラシミラ・ディムチェフスカ)とソフトウェア開発者のスヴィレン・ラネフは、ルールベースの英語文章生成器と、システムによって生成された文章を抽象芸術に変換するビジュアル構成ビルダーを組み合わせた計算システムを開発した。[ 81 ]このソフトウェアは、異なる色、形、サイズのパレットを用いて、無数の異なる画像を自動的に生成する。また、ユーザーは生成された文章の主題、またはビジュアル構成ビルダーで使用される1つまたは複数のパレットを選択できる。
コンピュータによる創造性の新たな分野として、ビデオゲームがあります。ANGELINAは、マイケル・クックによるJavaでビデオゲームを創造的に開発するためのシステムです。重要な機能の一つは、シンプルなゲームメカニクスとして機能する短いコードセグメントを生成できるシステムであるMechanic Minerです。[ 82 ] ANGELINAは、単純で解決不可能なゲームレベルをプレイし、新しいメカニクスによってレベルが解決可能になるかどうかをテストすることで、これらのメカニクスの有用性を評価することができます。Mechanic Minerはコード内のバグを発見し、それを利用してプレイヤーが問題を解決するための新しいメカニクスを作成します。[ 83 ]
2015年7月、Googleはオープンソースの[ 84 ]コンピュータービジョンプログラムであるDeepDreamをリリースしました。これは、画像内の顔やその他のパターンを検出して自動的に画像を分類することを目的として作成されたもので、畳み込みニューラルネットワークを使用してアルゴリズムによるパレイドリアを介して画像内のパターンを見つけて強化し、意図的に過剰処理された画像に夢のようなサイケデリックな外観を作成します。[ 85 ] [ 86 ] [ 87 ]
2015年8月、ドイツのテュービンゲン大学の研究者たちは、ニューラルネットワークを用いて任意の画像の内容とスタイルを分離・再結合する畳み込みニューラルネットワークを開発しました。このネットワークは、約1時間でピカソやゴッホなどの芸術作品の様式的な模倣画像を生成することができます。このアルゴリズムは、ユーザーが独自の芸術画像を作成できるウェブサイト「DeepArt」で利用されています。 [ 88 ] [ 89 ] [ 90 ] [ 91 ]
2016年初頭、世界的な研究チームが、デジタルシナプスニューラルサブストレート(DSNS)と呼ばれる新しい計算的創造性アプローチを用いて、エンドゲームデータベースから派生しないオリジナルのチェスパズルを生成する方法を発表しました。[ 92 ] DSNSは、確率的手法を用いて様々なオブジェクト(チェス問題、絵画、音楽など)の特徴を組み合わせ、新たな特徴仕様を導き出すことができます。この特徴仕様は、元のドメインのいずれにおいてもオブジェクトを生成するために使用できます。生成されたチェスパズルはYouTubeでも紹介されています。[ 93 ]
創造性は、問題解決において通常とは異なる解決策を生み出す際にも役立ちます。心理学と認知科学では、この研究分野は創造的問題解決と呼ばれています。創造性の明示的・暗黙的相互作用(EII)理論は、問題解決におけるインキュベーションと洞察のシミュレーションを可能にするCLARIONベースの計算モデルを使用して実装されています。 [ 94 ]この計算創造性プロジェクトの重点は、パフォーマンスそのものではなく(人工知能プロジェクトのように)、人間の創造性につながる心理的プロセスの説明と、心理学実験で収集されたデータの再現にあります。これまでのところ、このプロジェクトは、単純な記憶実験におけるインキュベーション効果、問題解決における洞察、問題解決におけるオーバーシャドウイング効果の再現を説明することに成功しています。
一部の研究者は、創造性は複雑な現象であり、それを記述するために用いる言語の可塑性によって研究がさらに複雑になると考えています。創造性の主体だけでなく、その成果物や方法も「創造的」と表現できます。したがって、創造性の一般理論を語ることは非現実的であると言えるかもしれません。しかしながら、生成原理の中には他の原理よりも一般的なものもあり、一部の支持者は特定の計算手法を「一般理論」であると主張しています。例えば、スティーブン・セイラーは、ニューラルネットワークの特定のモダリティは、高度な創造能力を発揮するのに十分な生成性と汎用性を備えていると提唱しています。
従来のコンピュータは、主に計算創造性の応用に用いられており、創造性をサポートしていません。なぜなら、コンピュータは、離散的かつ限定的な入力パラメータの領域を、限られた計算関数を用いて、離散的かつ限定的な出力パラメータの領域に変換するだけだからです。したがって、出力に含まれるすべての要素は、入力データまたはアルゴリズムに既に存在していたはずなので、コンピュータは創造的であることはできません。関連する議論や関連研究への参照は、シミュレーションの哲学的基礎に関する研究にまとめられています。[ 95 ]
数学的には、チャイティンも創造性に反対する同様の議論を展開している。[ 96 ]モデル理論の観点からも同様の観察がなされている。こうした批判はすべて、計算上の創造性は有用であり、創造性のように見えるかもしれないが、実際には何も新しいものが生み出されるわけではなく、明確に定義されたアルゴリズムによって変換されるだけなので、真の創造性ではないことを強調している。
マーク・リードルのような研究者によると、人間の創造性と現状のコンピュータによる創造性は、いくつかの側面で異なっている。創造性は道徳観の文脈で捉えられるが、リードルは物語の「教育的、道徳的」な側面が、物語生成AIモデルの開発における課題の一つであり、それがテキストの根底にある推論の一貫性に貢献する可能性があると考えている。[ 25 ] AIモデルにおける意図の欠如は、人間の創造性にしばしば見られる道徳的に責任ある選択を妨げている。[ 97 ]
ミシェル・ロイとエレオノーラ・ヴィガーノは、AIの発展が人間の創造性に及ぼす潜在的な脅威をいくつか特定した。例えば、ジョン・スチュアート・ミルが提唱した「人生の実験」への開放性は、創造性の重要な要素であると彼らは考えた。社会が意思決定においてアルゴリズムに過度に依存すると、効用関数が制約され、人々がよりリスクの高い解決策を模索することを躊躇し、探索の多様性、ひいては創造性が低下する可能性がある。[ 98 ]
国際計算創造性会議(ICCC)は計算創造性協会が主催し、毎年開催されています。[ 99 ]このシリーズのイベントには以下のものがあります。
これまで、計算創造性コミュニティは、1999 年以来毎年、専用のワークショップ「計算創造性に関する国際合同ワークショップ」を開催してきました。このシリーズの過去のイベントには、以下のものがあります。
第1回音楽創造性のコンピュータシミュレーション会議が開催されます
{{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{cite book}}: CS1 メンテナンス: 場所の発行元が見つかりません (リンク){{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク){{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)概念ブレンディングに関する特集号。{{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク) CS1 maint: 出版社の所在地 (リンク){{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク){{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク){{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{citation}}: CS1 maint: 複数の名前: 著者リスト (リンク){{cite book}}:|website=無視されました (ヘルプ){{cite book}}:|website=無視されました (ヘルプ)CS1 maint: 数値名: 著者リスト (リンク)