機械学習 (ML )は、データ から学習して未知のデータに一般化し 、明示的な指示なしに タスクを実行できる 統計アルゴリズム の開発と研究に関する人工知能 の研究分野 です。[ 1 ] 機械学習のサブ分野内では、ディープラーニング の分野の進歩により、統計アルゴリズムの一種であるニューラルネットワークが 、パフォーマンスにおいて以前の多くの機械学習アプローチを上回るようになりました。
MLは、自然言語処理 、コンピュータービジョン 、音声認識 、電子メールフィルタリング 、農業 、医療 など、多くの分野で応用されています。ビジネス上の問題へのMLの応用は、予測分析 として知られています。
統計学 と数学的最適化 (数理計画法)の手法は機械学習の基礎を構成しています。データマイニングは 関連研究分野であり、教師なし学習による 探索的データ分析 (EDA)に焦点を当てています。[ 3 ] [ 4 ]
理論的な観点から見ると、おそらく近似的に正しい学習は、 機械学習を記述するための数学的・統計的枠組みを提供します。この枠組みの下では、 従来の機械学習および深層学習アルゴリズムのほとんどは、経験的リスク最小化 として記述できます。
歴史 機械学習 という用語は、 IBMの 社員であり、コンピュータゲーム と人工知能 の分野の先駆者であるアーサー・サミュエル によって1959年に造られました。[ 5 ] [ 6 ] 同義語である自己学習型コンピュータ もこの時期に使用されていました。[ 7 ] [ 8 ]
最も初期の機械学習プログラムは、アーサー・サミュエルが チェッカーでそれぞれの側の勝利の可能性を計算するコンピュータプログラム を発明した1950年代に導入されましたが、機械学習の歴史は、人間の認知プロセスを研究したいという数十年にわたる人間の願望と努力にまで遡ります。 [ 9 ] 1949年、カナダの 心理学者ドナルド・ヘブは、 著書『行動の組織化』 を出版し、神経細胞 間の特定の相互作用によって形成される理論的な神経構造 を紹介しました。[ 10 ] ヘブの ニューロン が相互作用するモデルは、ノード、つまりコンピュータがデータを通信するために使用する人工ニューロン の下で、AIと機械学習アルゴリズムが機能する方法の基礎を築きました。[ 9 ] 人間の認知システム を研究した他の研究者も現代の機械学習技術に貢献しており、その中には、人間の思考プロセスを反映するアルゴリズム を生み出すためにニューラルネットワークの初期の数学的モデルを提唱した論理学者ウォルター・ピッツ やウォーレン・マカロックが含まれます 。 [ 9
1960年代初頭、レイセオン社は、 パンチテープ メモリを備えた実験的な「学習機械」、サイバートロンを開発しました。これは、初歩的な強化学習を用いて ソナー 信号、心電図 、音声パターンを分析するものでした。人間のオペレーター/教師によってパターン認識が繰り返し「訓練」され、誤った判断を再評価するための「失敗」ボタンが装備されていました。 [ 11 ] 1960年代の機械学習研究の代表的な書籍は、ニルス・ニルソン の『学習機械』で、主にパターン分類のための機械学習を扱っていました。[ 12 ] パターン認識に関する関心は1970年代まで続き、1973年にDudaとHartによって記述されました。 [ 13 ] 1981年には、人工ニューラルネットワークが コンピュータ端末から40文字(26文字、10数字、4特殊記号)を認識するように学習するための教育戦略の使用に関する報告がありました。 [ 14 ]
トム・M・ミッチェルは、 機械学習分野で研究されているアルゴリズムについて、広く引用されているより正式な定義を与えている。「コンピュータプログラムは、タスクT のクラスとパフォーマンス指標P に関して、経験Eから学習すると言われる。これは、 T におけるタスクのパフォーマンス( P によって測定)が、経験E とともに向上することを意味する。」[ 15 ] 機械学習に関わるタスクのこの定義は、認知的な用語で定義するのではなく、根本的に操作的な定義を提供している。これは、 アラン・チューリング が論文『計算機械と知能 』で提案した「機械は考えることができるか?」という問いを「機械は(思考する存在として)人間ができることができるか?」という問いに置き換えたものである。[ 16 ]
現代の機械学習アルゴリズムは、教師あり学習アルゴリズム、教師なし学習アルゴリズム、強化学習アルゴリズムの3つのアルゴリズムタイプに分類されます。[ 17 ]
現在の教師あり学習アルゴリズムは、分類と回帰を目的としています。 現在の教師なし学習アルゴリズムは、クラスタリング、次元削減、および相関ルールを目的としています。 現在の強化学習アルゴリズムは、過去の未知の時間に関して行う必要がある決定に重点を置いており、モデルベースの方法またはモデルフリーの方法のいずれかの研究に分類されます。 2014年にイアン・グッドフェローらは、現実的なデータ合成を備えた生成的敵対的ネットワーク(GAN)を導入しました。[ 18 ] 2016年までにAlphaGoは強化学習技術を使用してトップクラスの人間プレイヤーに勝利しました。[ 19 ]
他の分野との関係
人工知能 ディープラーニングは機械学習のサブセットであり、機械学習自体は 人工知能 のサブセットです。[ 20 ] 機械学習は、科学的な取り組みとして、人工知能 (AI)の探求から生まれました。AIが学問分野 として発展した初期には、一部の研究者が機械にデータから学習させることに興味を示しました。彼らは様々な記号的手法や、当時「ニューラルネットワーク 」と呼ばれていた手法を用いてこの問題に取り組もうとしました。これらは主にパーセプトロン などのモデルであり、後に統計学の 一般化線形モデル の再発明であることが判明しました。[ 21 ] 確率的推論 も、特に自動医療診断 において用いられました。[ 22 ] : 488
しかし、論理的で知識ベースのアプローチ が重視されるようになったことで、AIと機械学習の間に亀裂が生じました。確率システムは、データの取得と表現に関する理論的および実践的な問題に悩まされていました。[ 22 ] : 488 1980年までに、エキスパートシステムが AIを支配するようになり、統計は好まれなくなりました。[ 23 ] 記号/知識ベース学習の研究はAI内でも継続され、帰納的論理プログラミング(ILP) につながりましたが、より統計的な研究ラインは、 パターン認識 と情報検索の 分野で、AI本来の分野から外れていました。[ 22 ] : 708–710, 755 ニューラルネットワークの研究は、AIとコンピューターサイエンスによってほぼ同時期に放棄されていました。このラインも、AI / CS分野の外で、「 コネクショニズム」として、 ジョン・ホップフィールド 、デビッド・ルメルハート 、ジェフリー・ヒントン などの他の分野の研究者によって継続されました。彼らの主な成功は1980年代半ばのバックプロパゲーション の再発明によってもたらされた。[ 22 ] :25
機械学習(ML)は、再編され、独自の分野として認識され、1990年代に盛んに発展し始めました。この分野は、人工知能の実現という目標から、実用的な性質を持つ解決可能な問題への取り組みへと転換しました。AIから受け継いだ記号的アプローチから、統計学、 ファジー論理 、確率論 から借用した手法やモデルへと焦点を移していきました。[ 23 ]
データ圧縮 機械学習と圧縮の間には密接な関係があります。あるシーケンスの履歴全体に基づいて事後確率を予測するシステムは、出力分布に 算術符号化を 適用することで最適なデータ圧縮に利用できます。逆に、最適な圧縮器は予測に利用できます(過去の履歴に基づいて最も圧縮率の高いシンボルを見つけることで)。この等価性は、データ圧縮を「汎用知能」のベンチマークとして用いる根拠として用いられてきました。[ 24 ] [ 25 ] [ 26 ]
別の見方をすれば、圧縮アルゴリズムは文字列を暗黙的に暗黙的な特徴空間ベクトル にマッピングし、圧縮ベースの類似度測定はこれらの特徴空間内で類似度を計算する、ということができる。各圧縮器C(.)に対して、C(.)が入力文字列xをベクトルノルム||~x||に対応するようにマッピングするようなベクトル空間ℵを定義する。すべての圧縮アルゴリズムの基礎となる特徴空間を網羅的に調べることは空間の問題から不可能である。そこで、特徴ベクトルでは、代表的なロスレス圧縮方式であるLZW、LZ77、PPMの3つを検証する。[ 27 ]
AIXI理論( Hutter Prize でより直接的に説明されている関係)によれば、xの最良の圧縮とは、xを生成するソフトウェアが可能な限り最小であることです。例えば、このモデルでは、zipファイルの圧縮サイズにはzipファイルと解凍ソフトウェアの両方が含まれます。なぜなら、両方なしでは解凍できないからです。しかし、さらに小さな組み合わせの形式が存在する可能性があります。
AIを活用した音声/動画圧縮ソフトウェアの例としては、NVIDIA Maxine 、AIVCなどがあげられる。[ 28 ] AIを活用した画像圧縮が可能なソフトウェアの例としては、OpenCV 、TensorFlow 、MATLAB のImage Processing Toolbox(IPT)、High-Fidelity Generative Image Compressionなどがあげられる。[ 29 ]
教師なし機械学習 では、k平均法クラスタリングを用いて類似のデータポイントをクラスターにグループ化することでデータを圧縮することができます。この手法は、事前定義されたラベルを持たない大規模なデータセットの処理を簡素化し、 画像圧縮 などの分野で広く利用されています。[ 30 ]
データ圧縮は、データファイルのサイズを縮小し、ストレージ効率を高め、データ転送を高速化することを目的としています。教師なし機械学習アルゴリズムであるK平均法クラスタリングは、データセットを指定された数のクラスターkに分割するために用いられます。各クラスターは、その点の重心 によって表されます。このプロセスにより、大規模なデータセットは、よりコンパクトな代表点の集合に凝縮されます。特に画像 および信号処理 において有益なK平均法クラスタリングは、データ点のグループをその重心に置き換えることでデータ削減を支援します。これにより、元のデータのコア情報を維持しながら、必要なストレージ容量を大幅に削減できます。[ 31 ]
大規模言語モデル (LLM)も、DeepMind のChinchilla 70Bモデルを用いた研究で実証されているように、一部のデータセットでは効率的なロスレスデータ圧縮ツールである。DeepMindが開発したChinchilla 70Bは、画像の場合はPortable Network Graphics (PNG)や音声の場合はFree Lossless Audio Codec (FLAC)といった従来の方法よりも効果的にデータを圧縮した。画像と音声データはそれぞれ元のサイズの43.4%と16.4%に圧縮できた。しかし、テストに使用したデータセットがLLMのトレーニングデータセットと重複しており、Chinchilla 70Bモデルが既にトレーニング済みのデータに対してのみ効率的な圧縮ツールとなる可能性があることを懸念する理由がある。[ 32 ] [ 33 ]
データマイニング 機械学習とデータマイニングは 多くの場合、同じ手法を採用し、多くの点で重複しています。しかし、機械学習がトレーニングデータから学習した既知の 特性に基づく予測に重点を置くのに対し、データマイニングはデータ内の(以前は)未知の特性の 発見に重点を置きます(これはデータベースにおける 知識発見 の分析ステップです)。データマイニングでは多くの機械学習手法が用いられますが、その目的は異なります。一方で、機械学習はデータマイニング手法を「教師なし学習 」として、あるいは学習精度を向上させるための前処理ステップとして用いることもあります。これら2つの研究コミュニティ(ECML PKDDなど、別々の会議やジャーナルを持つことが多い)間の混乱の多くは、両者が用いる基本的な前提に起因しています。機械学習では、パフォーマンスは通常、 既知の知識を再現する 能力に関して評価されますが、知識発見とデータマイニング(KDD)では、主要なタスクはこれまで未知の 知識の発見です。既知の知識に基づいて評価すると、情報なし(教師なし)手法は他の教師あり手法よりも簡単にパフォーマンスが優れていますが、一般的な KDD タスクでは、トレーニング データが利用できないために教師あり手法は使用できません。
機械学習は最適化 とも密接な関係があります。多くの学習問題は、訓練例集合における損失関数の最小化として定式化されます。損失関数は、訓練対象のモデルの予測値と実際の問題例との間の乖離を表します(例えば、分類では、例に ラベル を割り当てたいと考え、モデルは予め割り当てられたラベルを一連の例に正しく予測するように訓練されます)。[ 34 ]
一般化 さまざまな学習アルゴリズムの一般化の特徴付けは、特に深層学習 アルゴリズム において、現在活発に研究されているトピックです。
統計 機械学習と統計学 は方法論的には密接に関連しているが、主な目的は異なっている。統計学はサンプル から母集団の推論 を導き出すのに対し、機械学習は一般化可能な予測パターンを見つける。[ 35 ]
従来の統計分析では、研究対象データセットに最も適したモデルを事前に選択する必要があります。さらに、過去の経験に基づいて有意または理論的に関連する変数のみが分析に含まれます。対照的に、機械学習は事前に構造化されたモデルに基づいて構築されるのではなく、データが根底にあるパターンを検出することでモデルを形成します。モデルの学習に使用される変数(入力)が多ければ多いほど、最終的なモデルの精度は高くなります。[ 36 ]
レオ・ブレイマンは 、データモデルとアルゴリズムモデルという2つの統計モデリングパラダイムを区別しました。[ 37 ] ここで「アルゴリズムモデル」とは、ランダムフォレスト のような機械学習アルゴリズムを意味します。
一部の統計学者は機械学習の手法を採用し、統計学習 と呼ぶ複合分野を形成しました。[ 38 ]
統計物理学 無秩序系の根深い物理学から派生した分析・計算技術は、機械学習を含む大規模な問題にまで拡張することができ、例えば深層ニューラルネットワーク の重み空間の解析などに応用できる。[ 39 ] 統計物理学はこのように医療診断 の分野で応用されつつある。[ 40 ]
理論学習器の中心的な目的は、経験から一般化することです。[ 2 ] [ 41 ] ここでの一般化とは、学習器が学習データセットを経験した後に、新しい未知の例やタスクを正確に実行できる能力のことです。訓練例は、一般的に未知の確率分布(発生空間の代表とみなされる)から得られ、学習器はこの空間に関する一般的なモデルを構築し、新しい事例において十分に正確な予測を生成できるようにする必要があります。
機械学習アルゴリズムとその性能の計算分析は、理論計算機科学の一分野であり 、計算学習理論 として知られ、おそらく近似的に正しい学習 モデルを介した 研究が行われている。訓練セットは有限であり、未来は不確実であるため、学習理論は通常、アルゴリズムの性能を保証するものではない。その代わりに、性能の確率的限界が一般的に用いられている。バイアス・分散分解は 、汎化誤差 を定量化する一つの方法である。
一般化の文脈において最良のパフォーマンスを得るには、仮説の複雑さがデータの根底にある関数の複雑さと一致する必要があります。仮説が関数よりも複雑でない場合、モデルはデータに過適合しています。それに応じてモデルの複雑さが増加すると、訓練誤差は減少します。しかし、仮説が複雑すぎると、モデルは過適合 になり、一般化は低下します。[ 42 ]
学習理論家は、性能限界に加えて、学習の時間計算量と実現可能性を研究します。計算学習理論では、計算が多項式時間で実行可能である場合、それは実現可能とみなされます。 時間計算量の 結果には2種類あります。肯定的な結果は、特定のクラスの関数が多項式時間で学習可能であることを示します。否定的な結果は、特定のクラスの関数が多項式時間で学習できないことを示します。
アプローチ
教師あり学習 では、トレーニング データに予想される回答のラベルが付けられますが、教師なし学習 では、モデルはラベル付けされていないデータ内のパターンまたは構造を識別します。機械学習のアプローチは、学習システムで利用できる「信号」または「フィードバック」の性質に応じて、学習パラダイムに対応する 3 つの広範なカテゴリに伝統的に分けられます。
教師あり学習 : コンピュータには「教師」によって与えられたサンプル入力とそれに対応する望ましい出力が提示され、入力を出力にマッピングする一般的なルールを学習することが目標となります。 教師なし学習 :学習アルゴリズムにはラベルが与えられず、入力データから構造を自ら発見することになります。教師なし学習は、それ自体が目標(データ内の隠れたパターンの発見)となる場合もあれば、目的達成のための手段(特徴学習 )となる場合もあります。強化学習 :コンピュータプログラムは、動的な環境と相互作用し、特定の目標(例えば、車両の運転 や対戦ゲームなど)を達成する必要があります。問題空間を進むにつれて、プログラムは報酬に類似したフィードバックを受け取り、それを最大化しようとします。[ 2 ] それぞれのアルゴリズムには利点と限界がありますが、すべての問題に有効な単一のアルゴリズムはありません。[ 43 ] [ 44 ] [ 45 ]
教師あり学習 サポートベクターマシンは、データを 線形境界 で区切られた領域に分割する教師あり学習モデルです。ここでは、線形境界が黒丸と白丸を分割しています。 教師あり学習アルゴリズムは、入力と望ましい出力の両方を含むデータセットの数学的モデルを構築します。[ 46 ] トレーニングデータ と呼ばれるデータは、トレーニング例のセットで構成されています。各トレーニング例には、1つ以上の入力と、教師信号とも呼ばれる望ましい出力があります。この数理モデルでは、各トレーニング例は配列 またはベクトル(特徴ベクトル と呼ばれることもあります)で表され、トレーニングデータは行列 で表されます。目的関数 の反復的な最適化 を通じて、教師あり学習アルゴリズムは、新しい入力に関連付けられた出力を予測するために使用できる関数を学習します。[ 47 ] 最適な関数により、アルゴリズムはトレーニングデータの一部ではなかった入力の出力を正しく決定できます。時間の経過とともに出力または予測の精度が向上するアルゴリズムは、そのタスクを実行するように学習したと言われます。[ 15 ]
教師あり学習アルゴリズムの種類には、能動学習 、分類 、回帰など がある。[ 48 ] 分類アルゴリズムは出力が限られた値に制限されている場合に使用され、回帰アルゴリズムは出力が一定範囲内の任意の数値を取る場合に使用される。例えば、電子メールをフィルタリングする分類アルゴリズムでは、入力は受信メールであり、出力はメールを保存するフォルダである。一方、回帰は、年齢や遺伝子などの要因に基づいて人の身長を予測したり、過去のデータに基づいて将来の気温を予測したりするなどのタスクに用いられる。[ 49 ]
類似度学習は 、回帰や分類と密接に関連する教師あり機械学習の分野ですが、その目的は、2つのオブジェクトの類似性または関連性を測定する類似度関数を用いて、事例から学習することです。ランキング 、レコメンデーションシステム 、ビジュアルアイデンティティ追跡、顔認証、話者認証などの分野で応用されています。
教師なし学習 教師なし学習アルゴリズムは、ラベル付け、分類、またはカテゴリー化されていないデータ内の構造を見つけます。フィードバックに応答する代わりに、教師なし学習アルゴリズムはデータ内の共通点を特定し、新しいデータごとにそのような共通点の有無に基づいて反応します。教師なし機械学習の中心的な応用には、クラスタリング、次元削減 [ 4 ] 、密度推定 [ 50 ] などがあります。
クラスター分析とは、観測データの集合をサブセット(クラスター と呼ばれる)に割り当てる手法です。これにより、同じクラスター内の観測データは、事前に指定された1つ以上の基準に基づいて類似し、異なるクラスターから抽出された観測データは類似しなくなります。クラスタリング手法によって、データの構造に関する仮定は異なります。多くの場合、この仮定は類似性指標 によって定義され、例えば、内部コンパクト性 (同じクラスターのメンバー間の類似性)や分離(クラスター間の相違)などによって評価されます。その他の手法は、 推定密度 とグラフの連結性 に基づいています。
自己教師学習 と呼ばれる特別なタイプの教師なし学習では、データ自体から教師信号を生成してモデルをトレーニングします。[ 51 ] [ 52 ]
次元削減 次元削減と は、主変数の集合を取得することで、検討中のランダム変数の数を減らすプロセスである。[ 53 ] 言い換えれば、特徴セットの次元(「特徴の数」とも呼ばれる)を減らすプロセスである。次元削減手法のほとんどは、特徴の除去または 抽出の いずれかとして考えることができる。次元削減の一般的な方法の1つは、主成分分析 (PCA)である。PCAでは、高次元データ(例:3D)をより小さな空間(例:2D)に変換する。多様体仮説 では、高次元データセットは低次元多様体に沿って存在すると提唱されており、多くの次元削減手法はこの仮定に基づいており、 多様体学習 や多様体正則化 の分野につながっている。
半教師あり学習 半教師あり学習は、教師なし学習 (ラベル付き学習データなし)と教師あり学習 (完全にラベル付き学習データあり)の中間に位置します。学習例の中には学習ラベルが欠落しているものもありますが、多くの機械学習研究者は、ラベルなしデータを少量のラベル付きデータと組み合わせて使用することで、学習精度が大幅に向上することを発見しています。
弱教師学習 では、訓練ラベルはノイズが多く、制限があり、不正確である。しかし、これらのラベルは入手コストが安いことが多く、結果として効果的な訓練セットが大きくなります。[ 54 ]
強化学習 強化学習では、エージェントは環境内でアクションを実行し、それによって報酬や状態の表現が生成され、それがエージェントにフィードバックされます。 強化学習は機械学習の一分野であり、ソフトウェアエージェントが 環境内で何らかの累積報酬の概念を最大化するためにどのように行動 すべきかに関係する。その汎用性のため、この分野はゲーム理論 、制御理論 、オペレーションズ リサーチ、情報理論 、シミュレーションに基づく 最適化、マルチエージェントシステム 、群知能、 統計 、遺伝的アルゴリズム など、他の多くの分野で研究されている。強化学習では、環境は通常、マルコフ決定過程 (MDP)として表現される。多くの強化学習アルゴリズムは動的計画法の 手法を使用する。[ 55 ] 強化学習アルゴリズムは、MDPの正確な数学的モデルの知識を前提とせず、正確なモデルが実行できない場合に使用される。強化学習アルゴリズムは、自律走行車や人間を相手にゲームをプレイするための学習に使用されている。
その他のタイプ この3つの分類にうまく当てはまらないアプローチも開発されており、同じ機械学習システムで複数のアプローチが用いられることもあります。例えば、トピックモデリング やメタ学習などが 挙げられます。[ 56 ]
自己学習 自己学習は、機械学習パラダイムとして、クロスバー適応アレイ (CAA)と呼ばれる自己学習可能なニューラルネットワークとともに1982年に導入されました。[ 57 ] [ 58 ] これは、感情を内部報酬として導入することにより、外部報酬なしで学習する問題の解決策を提供します。感情は自己学習エージェントの状態評価として使用されます。CAA自己学習アルゴリズムは、クロスバー形式で、アクションに関する決定と結果状況に関する感情(気持ち)の両方を計算します。このシステムは、認知と感情の相互作用によって駆動されます。[ 59 ] 自己学習アルゴリズムは、各反復で次の機械学習ルーチンを実行するようにメモリマトリックスW =||w(a,s)||を更新します。
状況S において行為A 結果状況を 受け取る 結果状況v(s')にいるときの感情を計算する クロスバーメモリの更新 w'(a,s) = w(a,s) + v(s') これは、状況という1つの入力と、行動(または行動)aという1つの出力のみを持つシステムです。環境からの別個の強化入力もアドバイス入力もありません。逆伝播された値(二次強化)は、結果状況に対する感情です。CAAは2つの環境、すなわち行動環境(CAAが行動する環境)と遺伝的環境(CAAが行動環境で遭遇する状況についての初期感情を最初に一度だけ受け取る環境)に存在します。遺伝的環境からゲノム(種)ベクトルを受け取った後、CAAは望ましい状況と望ましくない状況の両方を含む環境において、目標追求行動を学習します。[ 60 ]
特徴学習 いくつかの学習アルゴリズムは、トレーニング中に提供された入力のより良い表現を発見することを目的としている。[ 61 ] 古典的な例としては、主成分分析 とクラスター分析がある。特徴学習アルゴリズムは表現学習アルゴリズムとも呼ばれ、多くの場合、入力の情報を保持しようとするが、分類や予測を実行する前の前処理ステップとして、それが有用となるように変換する。この技術は、未知のデータ生成分布からの入力の再構築を可能にするが、その分布の下ではあり得ない構成に必ずしも忠実である必要はない。これは手動の特徴エンジニアリング に取って代わり、機械が特徴を学習し、それらを使用して特定のタスクを実行することを可能にする。
特徴学習は教師あり学習と教師なし学習のいずれかである。教師あり特徴学習では、ラベル付き入力データを用いて特徴を学習する。例としては、人工ニューラルネットワーク 、多層パーセプトロン 、教師あり辞書学習など が挙げられる。教師なし特徴学習では、ラベルなし入力データを用いて特徴を学習する。例としては、辞書学習、独立成分分析 、オートエンコーダ 、行列分解 [ 62 ] 、様々な形式のクラスタリング などが挙げられる。[ 63 ] [ 64 ] [ 65 ]
多様体学習 アルゴリズムは、学習した表現が低次元であるという制約の下で、これを試みる。スパース符号化 アルゴリズムは、学習した表現がスパースである、つまり数学モデルに多くのゼロがあるという制約の下で、これを試みる。多重線形部分空間学習アルゴリズムは、多次元データの テンソル 表現から、高次元ベクトルに変換することなく、低次元表現を直接学習することを目指す。 [ 66 ] 深層学習 アルゴリズムは、複数のレベルの表現、つまり特徴の階層を発見し、より高レベルで抽象的な特徴は、より低レベルの特徴によって定義される(または生成される)。知能機械は、観測データを説明する根本的な変動要因を解きほぐす表現を学習すると主張されてきた。[ 67 ]
特徴学習は、分類などの機械学習タスクでは、数学的かつ計算的に処理しやすい入力がしばしば必要となるという事実に端を発しています。しかしながら、画像、動画、感覚データといった実世界のデータにおいて、特定の特徴をアルゴリズム的に定義しようとする試みはこれまで行われてきませんでした。代替案として、明示的なアルゴリズムに依存せずに、検証を通じてそのような特徴や表現を発見することが挙げられます。
スパース辞書学習 スパース辞書学習は、訓練例を基底関数の線形結合として表現し、 スパース行列 と仮定する特徴学習法である。この方法はNP困難で あり、近似的に解くのが困難である。[ 68 ] スパース辞書学習の一般的なヒューリスティック手法は k -SVD アルゴリズムである。スパース辞書学習は、いくつかの状況に適用されている。分類では、問題は、これまでに見たことのない訓練例が属するクラスを決定することである。各クラスが既に構築されている辞書の場合、新しい訓練例は、対応する辞書によって最もスパースに表現されるクラスに関連付けられる。スパース辞書学習は、画像ノイズ 除去にも適用されている。重要な考え方は、クリーンな画像パッチは画像辞書によってスパースに表現できるが、ノイズは表現できないということである。[ 69 ]
異常検出 データマイニング において、異常検出(外れ値検出とも呼ばれる)とは、データの大部分と大きく異なることで疑念を抱かせる稀な項目、事象、または観測値を特定することである。[ 70 ] 典型的には、異常な項目は銀行詐欺、構造上の欠陥、医療上の問題、テキストの誤りなどの問題を表す。異常は、 外れ値 、新規性、ノイズ、逸脱、例外などと呼ばれる。 [ 71 ]
特に、不正利用やネットワーク侵入検知の文脈において、興味深いオブジェクトは稀なものではなく、予期せぬ非アクティブな突発的な活動であることが多い。このパターンは、稀なオブジェクトとしての外れ値という一般的な統計的定義には当てはまらない。多くの外れ値検出手法(特に教師なしアルゴリズム)は、適切に集約されない限り、このようなデータでは検出できない。代わりに、クラスター分析アルゴリズムは、これらのパターンによって形成されるマイクロクラスターを検出できる可能性がある。[ 72 ]
異常検出技術には、大きく分けて3つのカテゴリーがあります。[ 73 ] 教師なし異常検出技術は、ラベル付けされていないテストデータセット内のインスタンスの大部分が正常であるという仮定の下、データセットの残りの部分に最も適合しないと思われるインスタンスを探すことで異常を検出します。教師あり異常検出技術では、「正常」と「異常」のラベルが付けられたデータセットが必要であり、分類器のトレーニングが含まれます(他の多くの統計的分類問題との主な違いは、外れ値検出の本質的に不均衡な性質です)。半教師あり異常検出技術は、与えられた正常トレーニングデータセットから正常な動作を表すモデルを構築し、次にモデルによってテストインスタンスが生成される可能性をテストします。
ロボット学習 ロボット学習は、教師あり学習、強化学習、 [ 74 ] [ 75 ] 、そして最終的にはメタ学習 (例:MAML) に至るまで、多数の機械学習手法に影響を受けています。
相関ルール 相関ルール学習は、大規模データベース内の変数間の関係性を発見するためのルールベースの機械学習 手法です。これは、データベース内で発見された強力なルールを、何らかの「興味深さ」の尺度を用いて特定することを目的としています。[ 76 ]
ルールベース機械学習とは、知識を保存、操作、または適用するための「ルール」を識別、学習、または進化させる機械学習手法の総称です。ルールベース機械学習アルゴリズムの特徴は、システムによって捕捉された知識を集合的に表す一連の関係ルールを識別し、活用することです。これは、予測を行うためにあらゆるインスタンスに普遍的に適用できる単一のモデルを識別することが一般的な他の機械学習アルゴリズムとは対照的です。[ 77 ] ルールベース機械学習のアプローチには、学習分類システム 、相関ルール学習、人工免疫システム などがあります。
強いルールの概念に基づいて、Rakesh Agrawal 、Tomasz Imieliński 、Arun Swami は、スーパーマーケットの POS システムで記録された大規模なトランザクション データ内の製品間の規則性を発見するための関連ルールを導入しました。[ 78 ]たとえば 、スーパーマーケットの販売データで見つかったルールは、顧客が玉ねぎとジャガイモを一緒に購入する場合、ハンバーグも購入する可能性が高いことを示します。このような情報は、プロモーション価格 や製品の配置などのマーケティング活動に関する決定の基礎として使用できます。 マーケット バスケット分析 に加えて、関連ルールは現在、Web 使用状況マイニング 、侵入検知 、連続生産 、バイオインフォマティクス などのアプリケーション領域で使用されています。シーケンス マイニング とは対照的に、関連ルールの学習では通常、トランザクション内またはトランザクション間のアイテムの順序は考慮されません。 { o n 私 o n s 、 p o t 1つの t o e s } ⇒ { b あなた r グラム e r } {\displaystyle \{\mathrm {玉ねぎ、ジャガイモ} \}\Rightarrow \{\mathrm {ハンバーガー} \}}
学習分類システム (LCS)は、ルールベースの機械学習アルゴリズムの一種であり、発見コンポーネント(典型的には遺伝的アルゴリズム) と学習コンポーネント(教師あり学習 、強化学習 、または教師なし学習)を組み合わせたものです。LCSは、知識を集合的に蓄積し、それを 断片的 に適用することで予測を行う、文脈依存のルールセットを特定しようとします。[ 79 ]
帰納的論理プログラミング (ILP)は、入力例、背景知識、仮説を統一的に表現する論理プログラミングを用いてルールを学習するアプローチです。既知の背景知識の符号化と、事実の論理データベースとして表現された例の集合が与えられた場合、ILPシステムは、すべて正例を 含み 負例を含まない仮説論理プログラムを導出します。帰納的プログラミングは、 関数型プログラム など、仮説を表現するためのあらゆる種類のプログラミング言語(論理プログラミングに限らない)を検討する関連分野です。
帰納的論理プログラミングは、バイオインフォマティクス と自然言語処理 で特に有用である。ゴードン・プロトキン とエフード・シャピロ は、論理的な設定で帰納的機械学習の最初の理論的基礎を築いた。[ 80 ] [ 81 ] [ 82 ] シャピロは1981年に最初の実装(モデル推論システム)を構築した。それは、正例と負例から論理プログラムを帰納的に推論するPrologプログラムであった。 [ 83 ] ここでの帰納的 という用語は、順序付けられた集合のすべてのメンバーの特性を証明する 数学的帰納法 ではなく、観察された事実を説明する理論を示唆する哲学的 帰納法を指している。
モデル あ機械学習モデルは 、与えられたデータセットで「学習」すれば、新しいデータに対する予測や分類に使用できる数学モデル の一種です。学習中、学習アルゴリズムはモデルの内部パラメータを反復的に調整し、予測の誤差を最小限に抑えます。 [ 84 ] 拡張すると、「モデル」という用語は、一般的なクラスのモデルとそれに関連する学習アルゴリズムから、すべての内部パラメータが調整された完全に学習されたモデルまで、いくつかのレベルの特異性を指すことができます。 [ 85 ]
機械学習システムではさまざまな種類のモデルが使用および研究されており、タスクに最適なモデルを選択することをモデル選択 と呼びます。
人工ニューラルネットワーク 人工ニューラルネットワークは、脳 内の広大なニューロン ネットワークに似た、相互接続されたノード群です。ここでは、円形のノードはそれぞれ人工ニューロン を表し、矢印は1つの人工ニューロンの出力から別の人工ニューロンの入力への接続を表しています。人工ニューラルネットワーク(ANN)、あるいはコネクショニスト システムは、動物の脳を構成する 生物学的ニューラルネットワーク に漠然と着想を得たコンピューティングシステムです。このようなシステムは、通常、タスク固有のルールをプログラムすることなく、事例を検討することでタスクの実行を「学習」します。
ANNは、「人工ニューロン 」と呼ばれる接続されたユニットまたはノードの集合に基づくモデルであり、生物の脳のニューロンを大まかにモデル化しています。生物の脳の シナプス のように、各接続は、ある人工ニューロンから別の人工ニューロンへ情報(「信号」)を伝達することができます。信号を受信した人工ニューロンは、それを処理し、接続された他の人工ニューロンに信号を送信することができます。一般的なANN実装では、人工ニューロン間の接続における信号は実数 であり、各人工ニューロンの出力は、その入力の和の非線形関数によって計算されます。人工ニューロン間の接続は「エッジ」と呼ばれます。人工ニューロンとエッジは通常、学習の進行に応じて調整される重み を持ちます。この重みは、接続における信号の強度を増減させます。人工ニューロンには閾値が設定され、集約された信号がその閾値を超えた場合にのみ信号が送信される場合があります。通常、人工ニューロンは層状に集約されます。層ごとに、入力に対して異なる種類の変換を実行する場合があります。信号は、最初の層 (入力層) から最後の層 (出力層) まで、複数回層を通過した後に移動します。
ANNアプローチの当初の目標は、人間の脳 と同じように問題を解決することでした。しかし、時が経つにつれて、特定のタスクの実行に焦点が移り、生物学から逸脱するようになりました。人工ニューラルネットワークは、 コンピュータービジョン 、音声認識 、機械翻訳 、ソーシャルネットワーク フィルタリング、ボードゲームやビデオゲームのプレイ、 医療診断 など、さまざまなタスクに利用されてきました。
ディープラーニングは、 人工ニューラルネットワークの複数の隠れ層で構成されています。このアプローチは、人間の脳が光と音を視覚と聴覚に変換する過程をモデル化しようと試みています。ディープラーニングの成功例には、コンピュータービジョンや音声認識などがあります。[ 86 ]
決定木 タイタニック号 の乗客の生存確率を示す決定木決定木学習では、決定木を 予測モデル として使用し、項目 (枝で表す) に関する観察から項目のターゲット値 (葉で表す) に関する結論に進みます。これは、統計、データ マイニング、機械学習で使用される予測モデリング手法の 1 つです。ターゲット変数が離散的な値のセットを取ることができるツリー モデルは分類木と呼ばれます。これらのツリー構造では、葉は クラス ラベルを表し、枝はそれらのクラス ラベルにつながる特徴の結合を 表します。ターゲット変数が連続的な値 (通常は実数 ) を取ることができる決定木は回帰木と呼ばれます。意思決定分析では、決定木を使用して意思決定を視覚的に明示的に表現できます。 データ マイニングでは、決定木はデータを記述しますが、結果の分類木は意思決定の入力になります。
ランダムフォレスト回帰 ランダムフォレスト回帰(RFR)は、決定 木ベースのモデル の一種です。RFRは、複数の決定木を構築し、それらの予測値を平均化することで精度を向上させ、過剰適合を回避するアンサンブル学習法です。決定木の構築には、RFRはブートストラップサンプリングを用います。例えば、各決定木はトレーニングセットからランダムに抽出されたデータを用いてトレーニングされます。トレーニング用のRFRのランダムな選択により、モデルは偏った予測値を削減し、より高い精度を達成することができます。RFRは独立した決定木を生成し、単一出力データだけでなく多重回帰タスクにも適用できます。そのため、RFRは様々なアプリケーションで使用できます。[ 87 ] [ 88 ]
サポートベクターマシン サポートベクターマシン(SVM)はサポートベクターネットワークとも呼ばれ、分類と回帰に使用される関連する教師あり学習 手法のセットです。それぞれが2つのカテゴリのいずれかに属するようにマークされた一連のトレーニング例が与えられると、SVMトレーニングアルゴリズムは、新しい例がいずれかのカテゴリに分類されるかどうかを予測するモデルを構築します。[ 89 ] SVMトレーニングアルゴリズムは非確率的 、バイナリ 、線形分類器ですが、確率的分類設定でSVMを使用するための プラットスケーリング などの方法も存在します。線形分類の実行に加えて、SVMはカーネルトリック と呼ばれるものを使用して非線形分類を効率的に実行し、入力を高次元の特徴空間に暗黙的にマッピングすることができます。
回帰分析 データセットにおける線形回帰の図 回帰分析には、入力変数とそれに関連する特徴との関係を推定するさまざまな統計手法が含まれます。最も一般的な形式は線型回帰で、これは 、通常の最小二乗法 などの数学的基準に従って、与えられたデータに最もよく適合する単一の線を描画します。後者は、リッジ回帰 のように、過剰適合とバイアスを軽減するために正則化 手法によって拡張されることがよくあります。非線形問題を扱う場合の主力モデルには、多項式回帰 (たとえば、Microsoft Excel [ 90 ] でのトレンドラインのフィッティングに使用)、ロジスティック回帰( 統計分類 でよく使用)、さらにはカーネルトリック を利用して入力変数を暗黙的に高次元空間にマッピングすること で非線形性を導入するカーネル回帰などがあります。
多変量線形回帰は、 線形回帰の概念を拡張し、複数の従属変数を同時に扱うことができるようにしたものです。このアプローチは、多次元 線形モデルを当てはめることにより、一連の入力変数と複数の出力変数の関係を推定します。これは、複数の経済指標の予測や画像の再構成など、出力が相互に依存していたり、根本的なパターンを共有しているシナリオで特に有用です。 [ 91 ] これらは本質的に多次元です。
ベイジアンネットワーク シンプルなベイジアンネットワーク。雨はスプリンクラーの作動に影響を与え、雨とスプリンクラーの両方が芝生の濡れに影響を与えます。 ベイジアンネットワーク、ビリーフネットワーク、または有向非巡回グラフィカルモデルは、確率変数 の集合とその条件付き独立性を 有向非巡回グラフ (DAG)で表す確率グラフィカルモデル です。例えば、ベイジアンネットワークは、病気と症状の確率的な関係を表すことができます。症状が分かれば、このネットワークを用いて様々な病気の存在確率を計算できます。推論と学習を行う効率的なアルゴリズムが存在します。 音声信号 やタンパク質配列 などの変数のシーケンスをモデル化するベイジアンネットワークは、動的ベイジアンネットワーク と呼ばれます。不確実性下での意思決定問題を表現・解決できるベイジアンネットワークの一般化は、影響図と 呼ばれます。
ガウス過程 ガウス過程回帰(予測)と他の回帰モデルの比較例[ 92 ] ガウス過程は、過程内のランダム変数のすべての有限集合が多変量正規分布 を持ち、点のペアがその位置に応じて互いにどのように関係するかをモデル化する事前定義された共分散関数 、 またはカーネルに依存する確率過程です。
一連の観測点、または入力-出力例が与えられれば、観測点と、それらの点と新しい観測されていない点との間の共分散を調べることによって、入力データの関数としての新しい点の(観測されていない)出力の分布を直接計算できます。
ガウス過程は、ハイパーパラメータの最適化 を行うために使用されるベイズ最適化 における一般的な代替モデルです。
遺伝的アルゴリズム 遺伝的アルゴリズム(GA)は、自然選択 のプロセスを模倣した探索アルゴリズム およびヒューリスティック手法であり、 突然変異 や交差 などの手法を用いて新しい遺伝子型 を生成し、与えられた問題に対する優れた解決策を見つけることを目指します。機械学習において、遺伝的アルゴリズムは1980年代と1990年代に使用されました。[ 93 ] [ 94 ] 一方、機械学習技術は遺伝的アルゴリズムと進化的アルゴリズム の性能向上にも使用されてきました。[ 95 ]
信念関数 信念関数の理論は証拠理論やデンプスター・シェーファー理論とも呼ばれ、不確実性を伴う推論の一般的な枠組みであり、確率理論 、可能性 理論、 不正確な確率理論 などの他の枠組みとのつながりが理解されています。これらの理論的枠組みは一種の学習者と考えることができ、証拠の組み合わせ方に関して、いくつかの類似した特性(例えば、デンプスターの組み合わせ規則)があり、これはpmf ベースのベイズアプローチで確率を組み合わせる方法と似ています。[ 96 ] しかし、無知と不確実性の定量化 を組み込むベイズアプローチと比較すると、これらの信念関数には多くの注意点があります。機械学習ドメイン内で実装されるこれらの信念関数アプローチは、通常、さまざまなアンサンブル手法 の融合アプローチを活用して、標準的な機械学習アプローチでは解決が困難な傾向にある学習者の決定境界 、少ないサンプル数、あいまいなクラスの問題をより適切に処理します。[ 97 ] [ 6 ] しかし、これらのアルゴリズムの計算の複雑さは命題(クラス)の数に依存しており、他の機械学習のアプローチと比較すると計算時間が大幅に長くなる可能性があります。
ルールベースモデル ルールベース機械学習(RBML)は、データから「ルール」を自動的に発見・学習する機械学習の一分野です。解釈可能なモデルを提供することで、医療、不正検出、サイバーセキュリティといった分野における意思決定に役立ちます。RBMLの主要な技術には、学習分類システム 、[ 98 ] 、相関ルール学習 、[ 99 ] 、人工免疫システム 、[ 100 ] 、その他の類似モデルが含まれます。これらの手法は、データからパターンを抽出し、時間の経過とともにルールを進化させます。
トレーニングモデル 通常、機械学習モデルは、正確な予測を行うために大量の信頼できるデータを必要とします。機械学習モデルをトレーニングする場合、機械学習エンジニアは大規模で代表的なデータサンプル を対象として収集する必要があります。トレーニング セットのデータは、テキスト コーパス 、画像のコレクション、センサー データ、サービスの個々のユーザーから収集されたデータなど、多岐にわたります。機械学習モデルをトレーニングする際には、過剰適合に 注意する必要があります。偏ったデータや評価されていないデータから作成されたトレーニング済みモデルは、歪んだ予測や望ましくない予測につながる可能性があります。偏ったモデルは有害な結果をもたらす可能性があり、それによって社会や目標への悪影響が拡大します。アルゴリズムのバイアスは 、データがトレーニング用に完全に準備されていない場合に発生する可能性があります。機械学習倫理は研究分野になりつつあり、特に機械学習エンジニアリング チーム内に統合されつつあります。
連合学習 フェデレーテッドラーニングは、機械学習モデルのトレーニングに適応した分散型人工知能 の一種であり、トレーニングプロセスを分散化することで、ユーザーのデータを中央サーバーに送信する必要がないため、プライバシーが保護されます。また、トレーニングプロセスを複数のデバイスに分散化することで、効率性も向上します。例えば、Gboardはフェデレーテッド機械学習を用いて、個々の検索を Google に送り返すことなく、ユーザーのモバイル端末上で検索クエリ予測モデルをトレーニングしています。[ 101 ]
アプリケーション 機械学習には、次のような多くのアプリケーションがあります。
2006年、メディアサービスプロバイダーのNetflixは 、ユーザーの嗜好をより正確に予測し、既存の映画推薦アルゴリズムCinematchの精度を少なくとも10%向上させるプログラムを見つけるための最初の「Netflix Prize 」コンテストを開催しました。AT &T Labs -Researchの研究者で構成される共同チームは、Big ChaosおよびPragmatic Theoryチームと協力し、アンサンブルモデル を構築して2009年にグランプリを受賞し、100万ドルを獲得しました。[ 105 ] 受賞直後、Netflixは視聴者の評価が視聴パターンの最善の指標ではないことに気付き(「すべてが推薦である」)、それに応じて推薦エンジンを変更しました。[ 106 ] 2010年、ウォールストリートジャーナル の記事で、 Rebellion Researchが機械学習を使用して2008年の金融危機 を予測したことが報じられました。[ 107 ] 2012年、サン・マイクロシステムズ の共同設立者であるヴィノド・コスラは 、今後20年間で医師の職の80%が自動化された機械学習医療診断ソフトウェアによって失われると予測しました。[ 108 ] 2014年には、機械学習アルゴリズムが美術史の分野で美術絵画の研究に適用され、これまで認識されていなかったアーティストの影響が明らかになった可能性があることが報告されました。[ 109 ] 2019年、シュプリンガー・ネイチャーは 機械学習を使用して作成された最初の研究書を出版しました。[ 110 ] 2020年、機械学習技術は診断を支援し、COVID-19の治療法の開発で研究者を支援しました。[ 111 ] 機械学習は最近、旅行者の環境に優しい行動を予測するために適用されました。[ 112 ] 最近、機械学習技術は、ユーザーとスマートフォンのインタラクションに基づいてスマートフォンのパフォーマンスと熱挙動を最適化するためにも適用されました。[ 113 ] [ 114 ] [ 115 ] 機械学習アルゴリズム(MLA)は、適切に適用すれば、企業の幅広い特性を利用して、過剰適合することなく株式リターンを予測することができます。効果的な特徴量エンジニアリングを採用し、予測を組み合わせることで、MLAは OLS のような基本的な線形手法から得られる結果をはるかに上回る結果を生み出すことができます。[ 116 ]
機械学習の最近の進歩は量子化学の分野にも及んでおり、新しいアルゴリズムによって化学反応に対する溶媒の影響を予測できるようになり、化学者が最適な結果を得るために実験条件を調整するための新しいツールを提供しています。[ 117 ]
機械学習は、大規模災害および小規模災害における避難意思決定の調査と予測に有用なツールになりつつあります。山火事やハリケーン発生時に住宅所有者が避難するかどうか、またいつ避難するかを予測するための様々なソリューションがテストされています。[ 118 ] [ 119 ] [ 120 ] その他の応用例としては、建物火災における事前避難意思決定に焦点を当てたものがあります。[ 121 ] [ 122 ]
制限事項 機械学習はいくつかの分野で変革をもたらしてきましたが、機械学習プログラムは期待された結果をもたらさないことがよくあります。[ 123 ] [ 124 ] [ 125 ] その理由は数多くあります。適切なデータの不足、データへのアクセス不足、データの偏り、プライバシーの問題、タスクやアルゴリズムの不適切な選択、不適切なツールや人材、リソースの不足、評価の問題などです。[ 126 ]
「ブラックボックス理論 」は、もう一つの重要な課題を提起する。ブラックボックスとは、アルゴリズムまたは出力を生成するプロセスが完全に不透明な状況を指し、アルゴリズムの開発者でさえ、機械がデータから抽出したパターンを監査できないことを意味する。[ 127 ] 貴族院特別委員会は、「個人の生活に重大な影響を与える可能性のある」そのような「インテリジェンスシステム」は、「その決定について完全かつ納得のいく説明」を提供しない限り、受け入れられないと主張した。[ 127 ]
2018年、 Uber の自動運転車が歩行者を検知できず、衝突事故で歩行者が死亡しました。[ 128 ] IBM Watson システムを用いた機械学習を医療に活用する試みは、何年もの時間と数十億ドルの投資にもかかわらず、成果を上げることができませんでした。[ 129 ] [ 130 ] MicrosoftのBing Chat チャットボットは、ユーザーに対して敵対的で不快な応答を生成すると報告されています。[ 131 ]
機械学習は、システマティックレビューに関連するエビデンスの更新や、生物医学文献の増加に伴う査読者の負担増加に対処するための戦略として活用されてきました。学習セットの改善は進んでいますが、研究結果自体に必要な感度を制限することなく作業負荷を軽減できるほど十分には発展していません。[ 132 ]
説明可能性 説明可能なAI(XAI)、解釈可能なAI、説明可能な機械学習(XML)は、人間がAIの決定や予測を理解できる人工知能(AI)です。[ 133 ] これは、機械学習における「ブラックボックス」の概念とは対照的です。ブラックボックスの概念では、設計者でさえAIが特定の決定に至った理由を説明できません。[ 134 ] XAIは、AI搭載システムのユーザーのメンタルモデルを洗練し、誤解を解くことで、ユーザーがより効果的にパフォーマンスを発揮できるように支援します。XAIは、説明を受ける社会的権利の実現と言えるでしょう。
過剰適合 青い線は、ランダムノイズによる線形関数の過剰適合の例である可能性があります。 過去の訓練データ全てに当てはめるために、不適切で過度に複雑な理論に落ち着くことを過適合と呼びます。多くのシステムは、データへの適合度に応じて理論に報酬を与え、理論の複雑さに応じてペナルティを与えることで、過適合を軽減しようとします。
その他の制限と脆弱性 学習者は「間違った教訓を学ぶ」ことで失望することもあります。例えば、茶色の馬と黒猫の写真だけを学習した画像分類器は、茶色の斑点はすべて馬である可能性が高いと結論付ける可能性があります。現実世界の例としては、人間とは異なり、現在の画像分類器は画像内の構成要素間の空間的な関係性から判断を主に行うのではなく、人間が気づかないようなピクセル間の関係性を学習しますが、その関係性は特定の種類の現実の物体の画像と相関関係があります。正当な画像に対してこれらのパターンを変更すると、システムが誤分類する「敵対的」画像になる可能性があります。[ 137 ] [ 138 ]
敵対的脆弱性は、非線形システムや非パターン摂動によっても生じる可能性があります。一部のシステムでは、敵対的に選択された単一のピクセルを変更するだけで出力を変更することが可能となります。[ 139 ] 機械学習モデルは、敵対的機械学習 による操作や回避に対して脆弱であることがよくあります。[ 140 ]
研究者たちは、多くの場合第三者によって開発または訓練された機械学習モデル(例えば、投稿の「スパム」と「非スパム」のカテゴリ分け)に、バックドアを検知されない形で設置する方法を実証しました。第三者は 、ホワイトボックスアクセスを含む、ある種の データ/ソフトウェアの透明性 が提供される場合を含め、あらゆる入力の分類を変更することができます。[ 141 ] [ 142 ] [ 143 ]
モデル評価 機械学習モデルの分類は、ホールドアウト法などの精度推定手法によって検証できます。ホールドアウト 法では、データをトレーニングセットとテストセット(通常はトレーニングセットの2/3とテストセットの1/3の指定)に分割し、テストセットにおけるトレーニングモデルのパフォーマンスを評価します。これに対し、K分割交差検証 法では、データをランダムにK個のサブセットに分割し、K回の実験を実行します。各実験では、1つのサブセットを評価用、残りのK-1個のサブセットをモデルのトレーニング用とします。ホールドアウト法と交差検証法に加えて、データセットからn個のインスタンスを復元抽出するブートストラップ法を 使用して、モデルの精度を評価することができます。[ 144 ]
全体的な精度に加えて、研究者は感度と特異度 、つまりそれぞれ真陽性率(TPR)と真陰性率(TNR)を報告することがよくあります。同様に、研究者は偽陽性率 (FPR)と偽陰性率 (FNR)を報告することもあります。しかし、これらの率は分子と分母を明らかにすることができない比率です。受信者動作特性 (ROC)とそれに伴うROC曲線下面積(AUC)は、分類モデルの評価のための追加のツールとなります。AUCが高いほど、モデルのパフォーマンスは向上します。[ 145 ]
倫理
バイアス 機械学習のアプローチはそれぞれ異なり、データのバイアスも異なります。既存の顧客に特化した機械学習システムは、学習データに反映されていない新規顧客グループのニーズを予測できない可能性があります。一方、人間が作成したデータで学習した場合、機械学習は社会に既に存在する体質的バイアスや無意識のバイアスを拾い上げてしまう可能性が高くなります。[ 148 ]
バイアスを含んだデータセットで訓練されたシステムは、使用時にこれらのバイアス(アルゴリズムバイアス)を示す可能性があり、文化的偏見をデジタル化してしまう可能性があります。[ 149 ] 例えば、1988年、英国の人種平等委員会 は、セントジョージ医科大学 が過去の入学担当職員のデータから訓練されたコンピュータプログラムを使用していたところ、女性または非ヨーロッパ系の姓を持つ約60人の応募者を拒否していたことを発見しました。[ 148 ] 人種差別的な採用方針を持つ企業の求人データを使用すると、機械学習システムが過去の合格者との類似性に基づいて応募者を評価することで、バイアスを複製する可能性があります。[ 150 ] [ 151 ] 別の例としては、予測型警察企業Geolitica の予測アルゴリズムが挙げられます。このアルゴリズムは、過去の犯罪データで訓練された後、「低所得者層およびマイノリティコミュニティにおける過剰な警察活動のレベルが不釣り合いに高い」という結果が出ました。[ 152 ]
責任あるデータ収集 とシステムが使用するアルゴリズムルールの文書化は機械学習の重要な部分と考えられていますが、一部の研究者は、AI分野における少数派集団の参加と代表性の不足が機械学習のバイアスに対する脆弱性の原因であると考えています。[ 153 ] 実際、コンピューティング研究協会が2021年に実施した調査によると、世界中のいくつかの大学でAIに焦点を当てた教員全体のうち「女性教員はわずか16.1%を占める」とのことです。[ 154 ] さらに、「米国在住の新規AI博士号取得者」のグループでは、45%が白人、22.4%がアジア人、3.2%がヒスパニック系、2.4%がアフリカ系アメリカ人と回答しており、AI分野における多様性の欠如がさらに浮き彫りになっています。[ 154 ]
データから学習した言語モデルには、人間のようなバイアスが含まれていることが示されている。[ 155 ] [ 156 ] 人間の言語にはバイアスが含まれているため、言語コーパス で訓練された機械は必然的にこれらのバイアスも学習する。[ 157 ] [ 158 ] 2016年にマイクロソフトはTwitterから学習したチャットボット Tay をテストしたが、すぐに人種差別的および性差別的な言語を拾い上げた。[ 159 ]
調査報道機関 プロパブリカ が行った実験では、機械学習アルゴリズムが囚人の再犯率に関する知見から、「黒人被告人は白人被告人の2倍の頻度で高リスク」と誤ってフラグ付けした。[ 152 ] 2015年、Googleフォトは黒人2人をゴリラとしてタグ付けし、物議を醸した。その後、ゴリラのラベルは削除されたが、2023年現在もゴリラを認識できない。[ 160 ] 白人以外の人物を認識する際にも同様の問題が他の多くのシステムでも見つかっている。[ 161 ]
このような課題があるため、機械学習の効果的な活用が他の分野で採用されるまでには、より長い時間がかかる可能性があります。[ 162 ] 機械学習における公平性 、つまり機械学習のバイアスを減らし、人類の利益のために活用することへの懸念は、フェイフェイ・リー氏をはじめとする人工知能科学者によってますます表明されています。リー氏 は、「AIには人工的なものは何もありません。AIは人間によってインスピレーションを受け、人間によって作られ、そして最も重要なことは、人間に影響を与えるということです。AIは私たちが理解し始めたばかりの強力なツールであり、それは重大な責任です。」と述べています。[ 163 ]
金銭的インセンティブ 医療従事者の間では、これらのシステムが公共の利益ではなく、利益を生み出す機械として設計されているのではないかと懸念されています。これは特に米国において顕著で、医療の向上と利益の増大という長年の倫理的ジレンマが存在します。例えば、アルゴリズムは、アルゴリズムの所有者が利害関係を有する不必要な検査や投薬を患者に提供するように設計される可能性があります。医療における機械学習は、専門家に患者の診断、投薬、回復計画のための追加ツールを提供する可能性がありますが、そのためにはこれらのバイアスを軽減する必要があります。[ 164 ]
ハードウェア 2010 年代以降、機械学習アルゴリズムとコンピュータハードウェアの両方の進歩により、多くの層の非線形隠れユニットを含むディープニューラルネットワーク(機械学習の特定の狭いサブドメイン)をトレーニングするためのより効率的な方法が生まれました。 [ 165 ] 2019 年までに、多くの場合 AI 固有の機能強化を備えたグラフィックスプロセッシングユニット ( GPU ) が、大規模な商用クラウド AI をトレーニングするための主要な方法として CPU に取って代わりました。[ 166 ] OpenAI は、 AlexNet (2012)からAlphaZero (2017) までの最大のディープラーニングプロジェクトで使用されたハードウェアコンピューティングを推定し、必要なコンピューティング量が 30 万倍に増加し、倍増時間のトレンドラインは 3.4 か月であることを発見しました。[ 167 ] [ 168 ]
テンソルプロセッシングユニット(TPU)テンソルプロセッシングユニット(TPU)は、 Google が機械学習ワークロードに特化して開発した特殊なハードウェアアクセラレータです。汎用GPU やFPGA とは異なり、TPUはテンソル計算に最適化されており、トレーニングや推論などのディープラーニングタスクに特に効果的です。Google Cloud AIサービスや、GoogleのDeepMind AlphaFoldや大規模言語モデルなどの大規模機械学習モデルで広く使用されています。TPUは行列乗算 ユニットと高帯域幅メモリを活用して、エネルギー効率を維持しながら計算を高速化します。[ 169 ] 2016年の導入以来、TPUは特にクラウドベースの環境において、AIインフラストラクチャの重要なコンポーネントとなっています。
ニューロモルフィックコンピューティング ニューロモルフィック・コンピューティング とは、生物学的ニューラルネットワークの構造と機能をエミュレートするように設計されたコンピューティングシステムの一種です。これらのシステムは、従来のハードウェア上でのソフトウェアベースのシミュレーション、あるいは特殊なハードウェアアーキテクチャによって実装されます。[ 170 ]
物理的ニューラルネットワーク 物理ニューラルネットワークは、メモリスタなどの電気的に調整可能な材料を用いて 神経シナプス の機能を模倣する、ニューロモルフィックハードウェアの一種です。「物理ニューラルネットワーク」という用語は、ソフトウェアベースの実装ではなく、計算に物理的なハードウェアを用いることを強調しています。これは、調整可能な抵抗を持つ材料を用いて神経シナプスを複製する人工ニューラルネットワークを広く指します。[ 171 ] [ 172 ]
組み込み機械学習 組み込み機械学習は機械学習のサブフィールドであり、ウェアラブルコンピュータ 、エッジデバイス 、マイクロコントローラ などのコンピューティングリソースが限られた組み込みシステム にモデルが展開されます。[ 173 ] [ 174 ] [ 175 ] [ 176 ] これらのデバイスでモデルを直接実行すると、データを転送してクラウドサーバーに保存してさらに処理する必要がなくなり、データ侵害、プライバシー漏洩、知的財産、個人データ、企業秘密の盗難のリスクが軽減されます。 組み込み機械学習は、ハードウェアアクセラレーション 、[ 177 ] [ 178 ] 近似コンピューテ ィング、[ 179 ] モデル最適化など、さまざまな手法によって実現できます。[ 180 ] [ 181 ] 一般的な最適化手法には、プルーニング 、量子化 、知識蒸留 、低ランク因数分解、ネットワークアーキテクチャ検索、パラメーター共有などがあります。
ソフトウェア さまざまな機械学習アルゴリズムを含む ソフトウェア スイートには、次のようなものがあります。
無料のオープンソースソフトウェア
無料版とオープンソース版があるプロプライエタリソフトウェア
独自のソフトウェア
ジャーナル
会議
参照
参考文献 ^ 「明示的にプログラムされることなく」という定義は、1959年に「機械学習」という用語を造語したアーサー・サミュエル に帰属することが多いが、この出版物にはそのフレーズは逐語的には見られず、後世に現れた言い換えである可能性がある。Koza , John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). 「遺伝的プログラミングを用いたアナログ電気回路のトポロジーとサイズの両方の自動設計」Artificial Intelligence in Design '96 . Artificial Intelligence in Design '96. ドルドレヒト、オランダ: Springer Netherlands. pp. 151– 170. doi : 10.1007/978-94-009-0279-4_9 . ISBN 978-94-010-6610-5 。 ^ a b c ビショップ、CM (2006)、 パターン認識と機械学習 、シュプリンガー、 ISBN 978-0-387-31073-2 ^ 機械学習とパターン認識は「同じ分野の2つの側面として捉えることができる」 [ 2 ] 。 ^ a b フリードマン、ジェローム・H. (1998). 「データマイニングと統計:その関連性とは?」 コンピューティングサイエンスと統計 29 ( 1): 3–9 . ^ サミュエル、アーサー (1959). 「チェッカーゲームを用いた機械学習に関するいくつかの研究」. IBM Journal of Research and Development . 3 (3): 210– 229. CiteSeerX 10.1.1.368.2254 . doi : 10.1147/rd.33.0210 . S2CID 2126705 . ^ a b R. KohaviとF. Provost、「用語集」、機械学習、第30巻、第2~3号、271~274頁、1998年。 ^ Gerovitch, Slava (2015年4月9日). 「コンピューターはいかにしてソビエト連邦に復讐したか」 . Nautilus . 2021年9月22日時点の オリジナル よりアーカイブ。 2021年 9月19日 閲覧 。 ^ Lindsay, Richard P. (1964年9月1日). 「自動化が行政に与える影響」 . Western Political Quarterly . 17 (3): 78– 81. doi : 10.1177/106591296401700364 . ISSN 0043-4078 . S2CID 154021253. 2021年10月6日時点のオリジナルより アーカイブ 。 2021年 10月6日 閲覧 。 ^ a b c 「機械学習の歴史と進化:年表」 WhatIs . 2023年12月8日時点のオリジナルより アーカイブ 。 2023年 12月8日 閲覧 。 ^ ミルナー、ピーター・M. (1993). 「心とドナルド・O・ヘブ」. サイエン ティフィック・アメリカン . 268 (1): 124– 129. Bibcode : 1993SciAm.268a.124M . doi : 10.1038/scientificamerican0193-124 . ISSN 0036-8733 . JSTOR 24941344. PMID 8418480 . ^ 「科学:失敗ボタン」、タイム 、1961年8月18日。 ^ Nilsson, Nils J. (1965). 『学習機械 』McGraw-Hill. ^ Duda, R., Hart P.「パターン認識とシーン分析」Wiley Interscience, 1973 ^ S. Bozinovski, 「Teaching space: A represent concept for adaptive pattern classification」 COINS Technical Report No. 81-28, Computer and Information Science Department, University of Massachusetts at Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf 2021年2月25日アーカイブ 、Wayback Machine にて公開 ^ a b ミッチェル, T. (1997). 機械学習 . マグロウヒル. p. 2. ISBN 978-0-07-042807-2 。^ Harnad, Stevan (2008)、 「注釈ゲーム:チューリング(1950)の計算、機械、知能について」 、Epstein, Robert; Peters, Grace (編)、 『チューリングテストソースブック:思考するコンピュータの探求における哲学的および方法論的問題』 、Kluwer、pp. 23– 66、 ISBN 978-1-4020-6708-2 、2012年3月9日時点のオリジナルよりアーカイブ。 2012年 12月11日 閲覧。 ^ 「機械学習アルゴリズム」 . GeeksforGeeks . 2023年8月17日. 2025年 9月3日 閲覧 。 ^ Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi (2014). 生成的敵対的ネットワーク (PDF) . Advances in Neural Information Processing Systems 27 (2014). ^ Silver, David; Huang, Aja; Maddison, Christopher J. (2016). 「ディープニューラルネットワークとツリー探索による囲碁の攻略」 . Nature . 529 (7587): 484– 489. Bibcode : 2016Natur.529..484S . doi : 10.1038/nature16961 . PMID 26819042 . ^ Sindhu V, Nivedha S, Prakash M (2020年2月). 「機械学習におけるバイオインフォマティクスに関する実証科学研究」 . Journal of Mechanics of Continua and Mathematical Sciences (7). doi : 10.26782/jmcms.spl.7/2020.02.00006 . ^ Sarle, Warren S. (1994). 「ニューラルネットワークと統計モデル」. SUGI 19: 第19回SASユーザーグループ国際会議議事録 . SAS Institute. pp. 1538–50 . ISBN 978-1-55544-611-6 . OCLC 35546178 .^ a b c d ラッセル、スチュアート 、 ノーヴィグ、ピーター (2003) [1995]. 人工知能:現代的アプローチ (第2版). プレンティス・ホール. ISBN 978-0137903955 。^ a b Langley, Pat (2011). 「機械学習の変化する科学」 . 機械学習 . 82 (3): 275–9 . doi : 10.1007/s10994-011-5242-y . ^ マホニー、マット. 「大規模テキスト圧縮ベンチマークの根拠」 . フロリダ工科大学. 2006年8月18日時点の オリジナルよりアーカイブ。 2013年 3月5日 閲覧 。 ^ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). 「ユニバーサルデータ圧縮アルゴリズムによる日中外国為替市場の効率性の測定」 (PDF) . Computational Economics . 33 (2): 131– 154. CiteSeerX 10.1.1.627.3751 . doi : 10.1007/s10614-008-9153-3 . S2CID 17234503. 2009年7月9日時点のオリジナルより アーカイブ (PDF) . ^ Ben-Gal, I. (2008). 「ロバスト設計の分析におけるデータ圧縮尺度の使用について」 (PDF) . IEEE Transactions on Reliability . 54 (3): 381– 388. doi : 10.1109/TR.2005.853280 . S2CID 9376086. 2020年9月26日時点の オリジナル (PDF) からアーカイブ。 2016年 4月6日 閲覧 。 ^ D. Scully; Carla E. Brodley (2006). 「圧縮と機械学習:特徴空間ベクトルの新たな視点」. データ圧縮会議 (DCC'06) . p. 332. doi : 10.1109/DCC.2006.13 . ISBN 0-7695-2545-8 . S2CID 12311412 .^ Gary Adcock (2023年1月5日). 「AIビデオ圧縮とは?」 massive.io . 2023年 4月6日 閲覧 。 ^ ファビアン・メンツァー;トデリシ、ジョージ。チャネン、マイケル。アグストソン、エイリクール (2020)。 「高忠実度生成画像圧縮」。 arXiv : 2006.09965 [ eess.IV ]。 ^ 「教師なし学習とは? | IBM」 www.ibm.com 2021 年9月23日 2024年 2月5日 閲覧 。 ^ 「大規模データセット向けの差分プライベートクラスタリング」 blog.research.google . 2023年5月25日. 2024年 3月16日 閲覧 。 ^ Edwards, Benj (2023年9月28日). 「AI言語モデルはロスレス圧縮においてPNGやFLACを上回る可能性があると研究が発表」 Ars Technica . 2024年 3月7日 閲覧 。 ^ デレタン、グレゴワール;ルオス、アニアン。デュケンヌ、ポール・アンブロワーズ。キャット、エリオット。ジェネウェイン、ティム。マターン、クリストファー。グラウモヤ、ジョルディ。リー・ケビン・ウェンリャン。マシュー・アイチソン。オルソー、ローラン。ヒッター、マーカス。ジョエル・ヴェネス(2023)。 「言語モデリングは圧縮である」。 arXiv : 2309.10668 [ cs.LG ]。 ^ Le Roux, Nicolas; Bengio, Yoshua; Fitzgibbon, Andrew (2012). 「不確実性のモデリングによる一次および二次手法の改善」 . Sra, Suvrit; Nowozin, Sebastian; Wright, Stephen J. (編). 『 機械学習のための最適化』 . MIT Press. p. 404. ISBN 978-0-262-01646-9 . 2023年1月17日時点のオリジナルよりアーカイブ 。2020年11月12日 閲覧。^ Bzdok , Danilo; Altman, Naomi ; Krzywinski, Martin (2018). 「統計学と機械学習」 . Nature Methods . 15 (4): 233– 234. doi : 10.1038/nmeth.4642 . PMC 6082636. PMID 30100822 . ^ Hungら. ロボット手術における外科医のパフォーマンスを測定し臨床結果を予測するアルゴリズム. JAMA Surg. 2018 ^ コーネル大学図書館 (2001年8月). 「Breiman: 統計モデリング:二つの文化(著者によるコメントと反論付き)」 . 統計科学 . 16 (3). doi : 10.1214/ss/1009213726 . S2CID 62729017. 2017年6月26日時点のオリジナルより アーカイブ 。 2015年 8月8日 閲覧 。 ^ Gareth James、Daniela Witten、Trevor Hastie、Robert Tibshirani (2013). 『統計学習入門』 Springer. p. vii. 2019年6月23日時点のオリジナルより アーカイブ。 2014年 10月25日 閲覧 。 ^ Ramezanpour, A.; Beam, AL; Chen, JH; Mashaghi, A. (2020年11月17日). 「医療診断のための統計物理学:学習、推論、最適化アルゴリズム」 . 診断 . 10 ( 11): 972. doi : 10.3390/diagnostics10110972 . PMC 7699346. PMID 33228143 . ^ Mashaghi, A.; Ramezanpour, A. (2018年3月16日). 「医療診断の統計物理学:確率モデルの研究」. Physical Review E. 97 ( 3–1 ) 032118. arXiv : 1803.10019 . Bibcode : 2018PhRvE..97c2118M . doi : 10.1103/PhysRevE.97.032118 . PMID 29776109. S2CID 4955393 . ^ Mohri, Mehryar ; Rostamizadeh, Afshin ; Talwalkar, Ameet (2012). 『機械学習の基礎 』 米国マサチューセッツ州:MIT Press. ISBN 9780262018258 。^ Alpaydin, Ethem (2010). 『機械学習入門 』 ロンドン: MIT Press. ISBN 978-0-262-01243-0 . 2017年2月4日 閲覧 。^ Jordan, MI; Mitchell, TM (2015年7月17日). 「機械学習:トレンド、展望、そして将来展望」. Science . 349 ( 6245): 255– 260. Bibcode : 2015Sci...349..255J . doi : 10.1126/science.aaa8415 . PMID 26185243. S2CID 677218 . ^ El Naqa, Issam; Murphy, Martin J. (2015). 「機械学習とは何か?」. 放射線腫瘍学における機械学習 . pp. 3– 11. doi : 10.1007/978-3-319-18305-3_1 . ISBN 978-3-319-18304-6 . S2CID 178586107 .^ Okolie, Jude A.; Savage, Shauna; Ogbaga, Chukwuma C.; Gunes, Burcu (2022年6月). 「バイオ炭または活性炭を用いた廃水からの医薬品除去に関する研究における機械学習手法の可能性の評価」 . Total Environment Research Themes . 1– 2 100001. Bibcode : 2022TERT....100001O . doi : 10.1016/j.totert.2022.100001 . S2CID 249022386 . ^ ラッセル、スチュアート・J.、ノーヴィグ、ピーター (2010). 『人工知能:現代的アプローチ (第3版)』 プレンティス・ホール. ISBN 978-0-13-604259-4 。^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). 『機械学習の基礎 』 MIT Press. ISBN 978-0-262-01825-8 。^ Alpaydin, Ethem (2010). 機械学習入門 . MIT Press. p. 9. ISBN 978-0-262-01243-0 . 2023年1月17日時点のオリジナルよりアーカイブ 。2018年11月25日 閲覧。^ De Sa, Christopher (2022年春). 「Lecture 2 Notes: Supervised Learning」 . コーネル大学: コンピュータサイエンス. 2024年 7月1日 閲覧 。 ^ Jordan, Michael I.; Bishop, Christopher M. (2004). 「ニューラルネットワーク」. Allen B. Tucker編. コンピュータサイエンスハンドブック 第2版 (第7章 インテリジェントシステム) . フロリダ州ボカラトン: Chapman & Hall/CRC Press LLC. ISBN 978-1-58488-360-9 。^ Misra, Ishan; Maaten, Laurens van der (2020). プレテキスト不変表現の自己教師学習 . 2020 IEEE/CVF コンピュータービジョンとパターン認識会議. シアトル、ワシントン州、米国: IEEE . pp. 6707– 6717. arXiv : 1912.01991 . doi : 10.1109/CVPR42600.2020.00674 . ^ Jaiswal, Ashish; Babu, Ashwin Ramesh; Zadeh, Mohammad Zaki; Banerjee, Debapriya; Makedon, Fillia (2021年3月). 「対照的自己教師学習に関する調査」 . Technologies . 9 (1): 2. arXiv : 2011.00362 . doi : 10.3390/technologies9010002 . ISSN 2227-7080 . ^ Roweis, Sam T.; Saul, Lawrence K. (2000年12月22日). 「局所線形埋め込みによる非線形次元削減」 . Science . 290 (5500): 2323– 2326. Bibcode : 2000Sci...290.2323R . doi : 10.1126/science.290.5500.2323 . PMID 11125150. S2CID 5987139. 2021年8月15日時点のオリジナルより アーカイブ 。 2023年 7月17 日 閲覧 。 ^ Alex Ratner、Stephen Bach、Paroma Varma、Chris。 「Weak Supervision: The New Programming Paradigm for Machine Learning」 。hazyresearch.github.io。Hazy Researchの他の多くのメンバーによる研究を参照。 2019年6月6日時点の オリジナルよりアーカイブ。 2019年6 月 6日 閲覧 。 ^ van Otterlo, M.; Wiering, M. (2012). 「強化学習とマルコフ決定過程」. 強化学習 . 適応、学習、最適化. 第12巻. pp. 3– 42. doi : 10.1007/978-3-642-27645-3_1 . ISBN 978-3-642-27644-6 。^ Pavel Brazdil、Christophe Giraud Carrier、Carlos Soares、Ricardo Vilalta (2009). 『Metaearning: Applications to Data Mining (第4版)』 Springer Science+Business Media . pp. 10– 14, passim . ISBN 978-3-540-73262-4 。^ Bozinovski, S. (1982). 「二次強化を用いた自己学習システム」. Trappl, Robert (編). 『サイバネティクスとシステム研究:第6回ヨーロッパサイバネティクスとシステム研究会議議事録』. North-Holland. pp. 397–402. ISBN 978-0-444-86488-8 。 ^ Bozinovski, S. (1999)「クロスバー・アダプティブ・アレイ:遅延強化学習問題を解決した最初のコネクショニスト・ネットワーク」A. Dobnikar、N. Steele、D. Pearson、R. Albert(編)『人工ニューラルネットワークと遺伝的アルゴリズム』Springer Verlag、p. 320–325、ISBN 3-211-83364-1 ^ Bozinovski, Stevo (2014)「1981年以降の人工ニューラルネットワークにおける認知・感情相互作用のモデル化メカニズム」Procedia Computer Science p. 255–263 ^ Bozinovski, S. (2001)「自己学習エージェント:クロスバー価値判断に基づく感情のコネクショニスト理論」サイバネティクス・アンド・システムズ32(6)637-667。 ^ Y. Bengio; A. Courville; P. Vincent (2013). 「表現学習:レビューと新たな展望」. IEEE Transactions on Pattern Analysis and Machine Intelligence . 35 ( 8): 1798– 1828. arXiv : 1206.5538 . Bibcode : 2013ITPAM..35.1798B . doi : 10.1109/tpami.2013.50 . PMID 23787338. S2CID 393948 . ^ ネイサン・スレブロ;ジェイソンDMレニー。トミ・S・ジャーコラ (2004)。 最大マージン行列因数分解 。 NIPS 。 ^ Coates, Adam; Lee, Honglak; Ng, Andrew Y. (2011). 教師なし特徴学習における単層ネットワークの分析 (PDF) . 国際AI統計会議 (AISTATS). 2017年8月13日時点の オリジナル (PDF)からアーカイブ。 2018年 11月25日 閲覧 。 ^ Csurka, Gabriella; Dance, Christopher C.; Fan, Lixin; Willamowski, Jutta; Bray, Cédric (2004). Visual categorization with bags of keypoints (PDF) . ECCV Workshop on Statistical Learning in Computer Vision. 2019年7月13日時点のオリジナルより アーカイブ (PDF) 。 2019年 8月29日 閲覧 。 ^ ダニエル・ジュラフスキー、ジェームズ・H・マーティン (2009). 音声言語処理 . ピアソン・エデュケーション・インターナショナル. pp. 145– 146. ^ Lu, Haiping; Plataniotis, KN; Venetsanopoulos, AN (2011). 「テンソルデータのための多重線形部分空間学習の概観」 (PDF) . パターン認識 . 44 (7): 1540– 1551. Bibcode : 2011PatRe..44.1540L . doi : 10.1016/j.patcog.2011.01.004 . 2019年7月10日時点のオリジナルより アーカイブ (PDF) . 2015年 9月4日 閲覧 。 ^ ヨシュア・ベンジオ (2009). AIのためのディープラーニングアーキテクチャ . Now Publishers Inc. pp. 1– 3. ISBN 978-1-60198-294-0 . 2023年1月17日時点のオリジナルよりアーカイブ 。2016年2月15日 閲覧。^ Tillmann, AM (2015). 「厳密な辞書学習と近似的な辞書学習の計算上の難解性について」. IEEE Signal Processing Letters . 22 (1): 45– 49. arXiv : 1405.6664 . Bibcode : 2015ISPL...22...45T . doi : 10.1109/LSP.2014.2345761 . S2CID 13342762 . ^ Aharon, M , M Elad, A Bruckstein. 2006. 「 K-SVD:スパース表現のための過剰完備辞書設計アルゴリズム」 Wayback Machine に2018年11月23日アーカイブ 。信号処理、IEEE Transactions on 54(11): 4311–4322^ Zimek, Arthur; Schubert, Erich (2017)、「外れ値検出」、 Encyclopedia of Database Systems 、Springer New York、pp. 1– 5、 doi : 10.1007/978-1-4899-7993-3_80719-1 、 ISBN 978-1-4899-7993-3 ^ Hodge, VJ; Austin, J. (2004). 「外れ値検出手法の概観」 (PDF) . Artificial Intelligence Review . 22 (2): 85– 126. CiteSeerX 10.1.1.318.4023 . doi : 10.1007/s10462-004-4304-y . S2CID 59941878. 2015年6月22日時点のオリジナルより アーカイブ (PDF) . 2018年 11月25日 閲覧 . ^ Dokas, Paul; Ertoz, Levent; Kumar, Vipin; Lazarevic, Aleksandar; Srivastava, Jaideep; Tan, Pang-Ning (2002). 「ネットワーク侵入検知のためのデータマイニング」 (PDF) . NSFワークショップ「次世代データマイニング」議事録 . 2015年9月23日時点のオリジナルより アーカイブ (PDF) . 2023年 3月26日 閲覧 . ^ Chandola, V.; Banerjee, A.; Kumar, V. (2009). 「異常検出:サーベイ」. ACM Computing Surveys . 41 (3): 1– 58. doi : 10.1145/1541880.1541882 . S2CID 207172599 . ^ Fleer, S.; Moringen, A.; Klatzky, RL; Ritter, H. (2020). 「剛性触覚センサーアレイを用いた効率的な触覚形状探索の学習」, S. Fleer, A. Moringen, R. Klatzky, H. Ritter . PLOS ONE . 15 (1) e0226880. arXiv : 1902.07501 . doi : 10.1371/journal.pone.0226880 . PMC 6940144. PMID 31896135 . ^ モーリンゲン、アレクサンドラ;フリーア、サシャ。ウォルク、ギョーム。リッター、ヘルゲ (2020)、ニスキー、イラナ。ハーチャー・オブライエン、ジェス。ウィアトレフスキー、ミカエル。 Smeets、Jeroen (編)、「触覚インタラクションの注意ベースのロボット学習」、 ハプティクス: 科学、技術、アプリケーション 、コンピューター サイエンスの講義ノート、vol. 12272、Cham: Springer International Publishing、pp. 462–470 、 doi : 10.1007/978-3-030-58147-3_51 、 ISBN 978-3-030-58146-6 、S2CID 220069113 {{citation }}: CS1 maint: ISBNによる作業パラメータ(リンク )^ Piatetsky-Shapiro, Gregory (1991)、「強力なルールの発見、分析、および提示」 、Piatetsky-Shapiro, Gregory、および Frawley, William J. 編、『データベースにおける知識の発見』 、AAAI/MIT プレス、ケンブリッジ、MA。 ^ Bassel, George W.; Glaab, Enrico; Marquez, Julietta; Holdsworth, Michael J.; Bacardit, Jaume (2011年9月1日). 「大規模データセットにおけるルールベース機械学習を用いたアラビドプシスの機能ネットワーク構築」 . The Plant Cell . 23 (9): 3101– 3116. Bibcode : 2011PlanC..23.3101B . doi : 10.1105 / tpc.111.088153 . ISSN 1532-298X . PMC 3203449. PMID 21896882 . ^ Agrawal, R.; Imieliński, T.; Swami, A. (1993). 「大規模データベースにおけるアイテムセット間の相関ルールのマイニング」. 1993 ACM SIGMOD 国際データ管理会議 - SIGMOD '93 の議事録 . p. 207. CiteSeerX 10.1.1.40.6984 . doi : 10.1145/170035.170072 . ISBN 978-0-89791-592-2 . S2CID 490415 .^ Urbanowicz, Ryan J.; Moore, Jason H. (2009年9月22日). 「学習分類システム:完全な入門、レビュー、そしてロードマップ」 . Journal of Artificial Evolution and Applications . 2009年 : 1– 25. doi : 10.1155/2009/736398 . ISSN 1687-6229 . ^ Plotkin GD Automatic Methods of Inductive Inference Archived 22 December 2017 at the Wayback Machine 、博士論文、エディンバラ大学、1970年。 ^ Shapiro, Ehud Y.事実からの理論の帰納的推論 Archived 21 August 2021 at the Wayback Machine 、研究報告書192、Yale University、Department of Computer Science、1981年。J.-L. Lassez、G. Plotkin(編)、『Computational Logic』、The MIT Press、Cambridge、MA、1991年、pp. 199–254に再掲載。 ^ シャピロ、エフード・Y. (1983).アルゴリズムによるプログラムデバッグ . マサチューセッツ州ケンブリッジ: MIT プレス. ISBN 0-262-19218-7 ^ Shapiro, Ehud Y. 「モデル推論システム」 Wayback Machine に2023年4月6日にアーカイブ 。人工知能に関する第7回国際合同会議議事録第2巻。Morgan Kaufmann Publishers Inc.、1981年。 ^ Burkov, Andriy (2019). 100ページの機械学習の本 . ポーランド語: Andriy Burkov. ISBN 978-1-9995795-0-0 。^ ラッセル、スチュアート・J.、ノーヴィグ、ピーター (2021). 『人工知能:現代的アプローチ 』 ピアソン人工知能シリーズ(第4版) ホーボーケン:ピアソン. ISBN 978-0-13-461099-3 。^ Honglak Lee、Roger Grosse、Rajesh Ranganath、Andrew Y. Ng。「階層的表現のスケーラブルな教師なし学習のための畳み込みディープビリーフネットワーク」( Wayback Machine に2017年10月18日にアーカイブ )「機械学習に関する第26回年次国際会議の議事録、2009年。 ^ "RandomForestRegressor" . scikit-learn . 2025年 2月12日 閲覧 。 ^ 「ランダムフォレストとは? | IBM」 www.ibm.com 2021 年10月20日 2025年 2月12日 閲覧 。 ^ Cortes, Corinna ; Vapnik, Vladimir N. (1995). 「サポートベクターネットワーク」 . 機械学習 . 20 (3): 273– 297. doi : 10.1007/BF00994018 . ^ Stevenson, Christopher. 「チュートリアル:Excelでの多項式回帰」 facultystaff.richmond.edu . 2013 年6月2日時点のオリジナルより アーカイブ。 2017年 1月22日 閲覧 。 ^ ワンタ、ダミアン;スモリク、アレクサンダー。スモリック、ワルデマール・T.ミドゥラ、マテウシュ。ヴロブレフスキ、プシェミスワフ(2025)。 「静電容量トモグラフィーにおける機械学習された擬似逆関数を使用した画像再構成」 。 人工知能の工学的応用 。 142 109888. doi : 10.1016/j.engappai.2024.109888 。 ^ scikit-learn のドキュメントにも同様の例があります。2022年11月2日に Wayback Machine にアーカイブされています 。 ^ Goldberg, David E.; Holland, John H. (1988). 「遺伝的アルゴリズムと機械学習」 (PDF) . 機械学習 . 3 (2): 95– 99. doi : 10.1007/bf00113892 . S2CID 35506513. 2011年5月16日時点のオリジナルより アーカイブ (PDF) . 2019年 9月3日 閲覧 。 ^ Michie, D.; Spiegelhalter, DJ; Taylor, CC (1994). 「機械学習、ニューラルネットワーク、統計的分類」. Ellis Horwood人工知能シリーズ . 書誌コード : 1994mlns.book.....M . ^ 張、潤;ジャン・ジーフイ。リン、イン。チェン、ニー。ゴン、ユエジャオ。チョン・ジンヒ。チョン、ヘンリー SH;リー、ユン。石裕輝(2011)。 「進化的計算と機械学習の出会い: 調査」。 IEEE コンピューティング インテリジェンス マガジン 。 6 (4): 68–75 。 Bibcode : 2011ICIM....6d..68Z 。 土井 : 10.1109/mci.2011.942584 。 S2CID 6760276 。 ^ Verbert, K.; Babuška, R.; De Schutter, B. (2017年4月1日). 「知識ベース故障診断のためのベイズ推論とデンプスター・シェーファー推論の比較研究」 . 人工知能工学応用 . 60 : 136–150 . doi : 10.1016/j.engappai.2017.01.011 . ISSN 0952-1976 . ^ Yoosefzadeh-Najafabadi, Mohsen; Hugh, Earl; Tulpan, Dan; Sulik, John; Eskandari, Milad (2021). 「植物育種における機械学習アルゴリズムの応用:大豆のハイパースペクトル反射率から収量予測?」 Front . Plant Sci . 11 624273. Bibcode : 2021FrPS...1124273Y . doi : 10.3389/fpls.2020.624273 . PMC 7835636. PMID 33510761 . ^ Urbanowicz, Ryan J.; Moore, Jason H. (2009年9月22日). 「学習分類システム:完全な入門、レビュー、そしてロードマップ」 . Journal of Artificial Evolution and Applications . 2009年 : 1– 25. doi : 10.1155/2009/736398 . ISSN 1687-6229 . ^ Zhang, C. および Zhang, S., 2002.「相関ルールマイニング:モデルとアルゴリズム 」 Springer-Verlag. ^ De Castro、Leandro Nunes、Jonathan Timmis.人工免疫システム:新たな計算知能アプローチ . Springer Science & Business Media, 2002. ^ 「Federated Learning: Collaborative Machine Learning without Centralized Training Data」 Google AI Blog 2017年4月6日。 2019年6月7日時点のオリジナルより アーカイブ。 2019年 6月8日 閲覧 。 ^ 機械学習はCFAカリキュラム に含まれています。参照: [1] {{Webarchive|url= https://www.cfainstitute.org/ ^ Marcos M. López de Prado (2010). 『資産運用者のための機械学習』 ケンブリッジ大学出版局 . ISBN 9781108883658 ^ イヴァネンコ、ミハイル;スモリック、ワルデマール・T.ワンタ、ダミアン。ミドゥラ、マテウシュ。ヴロブレフスキ、プシェミスワフ。ホウ、シャオハン。ヤン・シャオヘン (2023) 「胸部のウェアラブル電気インピーダンス断層撮影における教師あり学習を使用した画像再構成」 。 センサー 。 23 (18): 7774。 Bibcode : 2023Senso..23.7774I 。 土井 : 10.3390/s23187774 。 PMC 10538128 。 PMID 37765831 。 ^ 「BelKorホームページ」 research.att.com^ 「Netflix Tech Blog: Netflixのおすすめ:5つ星を超えて(パート1)」 。2012年4月6日。 2016年5月31日時点の オリジナル よりアーカイブ 。 2015年 8月8日 閲覧。 ^ スコット・パターソン (2010年7月13日). 「Letting the Machines Decide」 . ウォール・ストリート・ジャーナル . 2018年6月24日時点のオリジナルより アーカイブ。 2018年 6月24日 閲覧 。 ^ Vinod Khosla (2012年1月10日). 「私たちには医師とアルゴリズムのどちらが必要か?」 . Tech Crunch. 2018年6月18日時点のオリジナルより アーカイブ。 2016年 10月20日 閲覧 。 ^ 機械学習アルゴリズムが美術史家がこれまで気づかなかった絵画を研究したところ、 2016年6月4日に Wayback Machine にアーカイブ 、 The Physics at ArXiv ブログ ^ ヴィンセント・ジェームズ (2019年4月10日). 「AIが生成した初の教科書は、ロボット作家の真の実力を示している」 The Verge . 2019年5月5日時点のオリジナルより アーカイブ。 2019年 5月5日 閲覧 。 ^ ヴァイシャ、ラジュ;ジャワイド、モハド。カーン、イブラヒム・ハリーム。アビド、ハリーム(2020年7月1日)。 「新型コロナウイルス感染症パンデミックに対する人工知能 (AI) アプリケーション」 。 糖尿病とメタボリックシンドローム: 臨床研究とレビュー 。 14 (4): 337–339 。 土井 : 10.1016/j.dsx.2020.04.012 。 PMC 7195043 。 PMID 32305024 。 ^ Rezapouraghdam, Hamed; Akhshik, Arash; Ramkissoon, Haywantee (2021年3月10日). 「海洋保護区における訪問者の環境配慮行動予測への機械学習の応用:キプロスにおける証拠」 . Journal of Sustainable Tourism . 31 (11): 2479– 2505. doi : 10.1080/09669582.2021.1887878 . hdl : 10037/24073 . ^ Dey, Somdip; Singh, Amit Kumar; Wang, Xiaohang; McDonald-Maier, Klaus (2020年6月15日). 「CPU-GPUモバイルMPSoCの電力効率と熱効率のためのユーザーインタラクションを考慮した強化学習」 . 2020 Design, Automation & Test in Europe Conference & Exhibition (DATE) (PDF) . pp. 1728– 1733. doi : 10.23919/DATE48585.2020.9116294 . ISBN 978-3-9819263-4-7 . S2CID 219858480 . 2021年12月13日時点のオリジナルよりアーカイブ 。2022年1月20日 閲覧。^ トニー・クエストド 「エセックスのイノベーションでスマートフォンがさらにスマートに」 Business Weekly . 2021年6月24日時点のオリジナルより アーカイブ。 2021年 6月17日 閲覧 。 ^ ウィリアムズ、リアノン(2020年7月21日) 「将来のスマートフォンは、所有者の行動を監視することでバッテリー寿命を延ばす」 . i . 2021年6月24日時点のオリジナルよりアーカイブ 。2021年 6月17日 閲覧 。^ Rasekhschaffe, Keywan Christian; Jones, Robert C. (2019年7月1日). 「 株式選択のための機械学習」 . Financial Analysts Journal . 75 (3): 70– 88. doi : 10.1080/0015198X.2019.1596678 . ISSN 0015-198X . S2CID 108312507. 2023年11月26日時点のオリジナルより アーカイブ。 2023年 11月26日 閲覧 。 ^ Chung, Yunsie; Green, William H. (2024). 「量子化学からの機械学習による反応速度に対する実験溶媒効果の予測」 . Chemical Science . 15 (7): 2410– 2424. doi : 10.1039/D3SC05353A . ISSN 2041-6520 . PMC 10866337. PMID 38362410 . ^ Sun, Yuran; Huang, Shih-Kai; Zhao, Xilei (2024年2月1日). 「解釈可能な機械学習手法によるハリケーン避難決定の予測」 . International Journal of Disaster Risk Science . 15 (1): 134– 148. arXiv : 2303.06557 . Bibcode : 2024IJDRS..15..134S . doi : 10.1007/s13753-024-00541-1 . ISSN 2192-6395 . ^ Sun, Yuran; Zhao, Xilei; Lovreglio, Ruggiero; Kuligowski, Erica (2024年1月1日)、Naser, MZ (編)、 「8 - AI for large-scale evacuation modeling: promises and challenges」 、 Interpretable Machine Learning for the Analysis, Design, Assessment, and Informed Decision Making for Civil Infrastructure 、Woodhead Publishing Series in Civil and Structural Engineering、Woodhead Publishing、pp. 185– 204、 ISBN 978-0-12-824073-1 、2024年5月19日時点のオリジナルよりアーカイブ。 2024年 5月19日 閲覧。 {{citation }}: CS1 maint: ISBNによる作業パラメータ(リンク )^ Xu, Ningzhe; Lovreglio, Ruggiero; Kuligowski, Erica D.; Cova, Thomas J.; Nilsson, Daniel; Zhao, Xilei (2023年3月1日). 「機械学習を用いた山火事避難意思決定の予測と評価:2019年キンケード火災の知見」. Fire Technology . 59 (2): 793– 825. doi : 10.1007/s10694-023-01363-1 . ISSN 1572-8099 . ^ Wang, Ke; Shi, Xiupeng; Goh, Algena Pei Xuan; Qian, Shunzhi (2019年6月1日). 「機械学習を用いた緊急避難時の歩行者移動ダイナミクスに関する研究」 . Fire Safety Journal . 106 : 163–176 . Bibcode : 2019FirSJ.106..163W . doi : 10.1016/j.firesaf.2019.04.008 . hdl : 10356/143390 . ISSN 0379-7112 . 2024年5月19日時点のオリジナルより アーカイブ。 2024年 5月19日 閲覧 。 ^ Zhao, Xilei; Lovreglio, Ruggiero; Nilsson, Daniel (2020年5月1日). 「機械学習を用いた避難前意思決定のモデル化と解釈」 . Automation in Construction . 113 103140. doi : 10.1016/j.autcon.2020.103140 . hdl : 10179/17315 . ISSN 0926-5805 . 2024年5月19日時点のオリジナルより アーカイブ。 2024年 5月19日 閲覧 。 ^ 「機械学習モデルが学習に失敗する理由:QuickTake Q&A」 Bloomberg.com 、2016年11月10日。 2017年3月20日時点の オリジナル よりアーカイブ。 2017年 4月10日 閲覧 。 ^ 「企業AIの第一波は失敗する運命にある」 ハーバード ・ビジネス・レビュー 、2017年4月18日。 2018年8月21日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ 「AIへの熱狂はなぜ失敗するのか」 VentureBeat 、 2016年9月18日。 2018年8月19日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ 「機械学習プロジェクトが失敗する9つの理由」 www.kdnuggets.com . 2018 年 8月21日時点のオリジナルより アーカイブ 。 2018年 8月20日 閲覧。 ^ a b Babuta, Alexander; Oswald, Marion; Rinik, Christine (2018). Transparency and Intelligibility (Report). Royal United Services Institute (RUSI). pp. 17– 22. 2023年12月9日時点のオリジナルより アーカイブ。 2023年 12月9日 閲覧 。 ^ 「ウーバーの自動運転車が歩行者を死亡させた理由」 エコノミスト 誌 。 2018年8月21日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ 「IBMのワトソンが『安全でない、間違った』がん治療を推奨 - STAT」 STAT 2018年7月25日。 2018 年8月21日時点のオリジナルより アーカイブ。 2018年 8月21日 閲覧 。 ^ ヘルナンデス、ダニエラ、グリーンウォルド、テッド(2018年8月11日) 「IBMはワトソンのジレンマに直面」 ウォール ・ストリート・ジャーナル 。ISSN 0099-9660 。 2018 年8月21日時点のオリジナルより アーカイブ。 2018年 8月21日 閲覧 。 ^ Allyn, Bobby (2023年2月27日). 「マイクロソフトの人工知能技術実験はいかに裏目に出たか」 ナショナル ・パブリック・ラジオ . 2023年12月8日時点のオリジナルより アーカイブ。 2023年 12月8日 閲覧 。 ^ Reddy, Shivani M.; Patel, Sheila; Weyrich, Meghan; Fenton, Joshua; Viswanathan, Meera (2020). 「 エビデンス更新戦略としての従来のシステマティックレビューアプローチとレビューオブレビューおよび半自動化との比較」 . Systematic Reviews . 9 (1): 243. doi : 10.1186/s13643-020-01450-2 . ISSN 2046-4053 . PMC 7574591. PMID 33076975 . ^ Rudin, Cynthia (2019). 「重要な意思決定においてブラックボックス型の機械学習モデルの説明をやめ、解釈可能なモデルを使用する」 . Nature Machine Intelligence . 1 (5): 206– 215. doi : 10.1038 / s42256-019-0048-x . PMC 9122117. PMID 35603010 . ^ Hu, Tongxi; Zhang, Xuesong; Bohrer, Gil; Liu, Yanlan; Zhou, Yuyu; Martin, Jay; LI, Yang; Zhao, Kaiguang (2023). 「説明可能なAIと解釈可能な機械学習による作物収量予測:気候変動が作物収量に与える影響を評価するためのブラックボックスモデルの危険性」 . 農業森林気象学 . 336 109458. Bibcode : 2023AgFM..33609458H . doi : 10.1016/j.agrformet.2023.109458 . S2CID 258552400 . ^ 「1ピクセルの変化がAIプログラムを欺く」 BBC ニュース 2017年11月3日. 2018年3月22日時点のオリジナルより アーカイブ。 2018年 3月12日 閲覧 。 ^ 「AIには幻覚の問題があるが、解決は困難であることが判明」 WIRED . 2018年. 2018年3月12日時点のオリジナルより アーカイブ 。 2018年 3月12日 閲覧。 ^ Madry, A.; Makelov, A.; Schmidt, L.; Tsipras, D.; Vladu, A. (2019年9月4日). 「敵対的攻撃に耐性のあるディープラーニングモデルに向けて」. arXiv : 1706.06083 [ stat.ML ]. ^ 「Adversarial Machine Learning – CLTC UC Berkeley Center for Long-Term Cybersecurity」 CLTC . 2022 年5月17日時点のオリジナルより アーカイブ 。 2022年 5月25日 閲覧。 ^ 「機械学習モデル、検出不可能なバックドアに脆弱」 The Register . 2022年5月13日時点のオリジナルより アーカイブ。 2022年 5月13日 閲覧 。 ^ 「Undetectable Backdoors Plantable In Any Machine-Learning Algorithm」 IEEE Spectrum 2022年5月10日。 2022年5月11日時点のオリジナルより アーカイブ。 2022年 5月13日 閲覧 。 ^ Goldwasser, Shafi; Kim, Michael P.; Vaikuntanathan, Vinod; Zamir, Or (2022年4月14日). 「機械学習モデルにおける検出不可能なバックドアの設置」. arXiv : 2204.06974 [ cs.LG ]. ^ Kohavi, Ron (1995). 「精度推定とモデル選択のためのクロスバリデーションとブートストラップの研究」 (PDF) . 国際人工知能合同会議 . 2018年7月12日時点のオリジナルより アーカイブ (PDF) . 2023年 3月26日 閲覧 。 ^ Catal, Cagatay (2012). 「ソフトウェア障害予測研究のためのパフォーマンス評価メトリクス」 (PDF) . Acta Polytechnica Hungarica . 9 (4) . 2016年 10月2日 閲覧 。 ^ a b Müller, Vincent C. (2020年4月30日). 「人工知能とロボット工学の倫理」 . スタンフォード哲学百科事典 . 2020年10月10日時点のオリジナルより アーカイブ。 ^ 「将来の人工知能の潜在的なリスク、メリット、政策上の要請の評価」 OECD 、 2024年11月14日。 2025年 8月4日 閲覧 。 ^ a b ガルシア、ミーガン(2016年)「機械の中の人種差別主義者」 ワールドポリシージャーナル . 33 (4): 111– 117. doi : 10.1215/07402775-3813015 . ISSN 0740-2775 . S2CID 151595343 . ^ Bostrom, Nick (2011). 「人工知能の倫理」 (PDF) . 2016年3月4日時点の オリジナル (PDF) からアーカイブ。 2016年 4月11日 閲覧 。 ^ Edionwe, Tolulope. 「人種差別的なアルゴリズムとの戦い」 . The Outline . 2017年11月17日時点のオリジナルより アーカイブ。 2017年 11月17日 閲覧 。 ^ ジェフリーズ、エイドリアンヌ。 「機械学習は人種差別的だ。なぜならインターネットが人種差別的だからだ」 。 アウトライン 。 2017年11月17日時点のオリジナルより アーカイブ。 2017年 11月17日 閲覧 。 ^ a b シルバ、セレナ、ケニー、マーティン (2018). 「アルゴリズム、プラットフォーム、そして民族的偏見:統合的エッセイ」 (PDF) . Phylon . 55 (1 & 2): 9– 37. ISSN 0031-8906 . JSTOR 26545017. 2024年1月27日時点のオリジナルより アーカイブ (PDF) . ^ Wong, Carissa (2023年3月30日). 「AIの『公平性』研究 は 多様性の欠如によって阻まれている」 . Nature . doi : 10.1038/d41586-023-00935-z . PMID 36997714. S2CID 257857012. 2023年4月12日時点のオリジナルより アーカイブ 。 2023年 12月9日 閲覧 。 ^ a b Zhang, Jack Clark. 「人工知能指数レポート2021」 (PDF) . スタンフォード大学人間中心人工知能研究所 . 2024年5月19日時点の オリジナル (PDF) からアーカイブ。 2023年 12月9日 閲覧 。 ^ Caliskan, Aylin; Bryson, Joanna J.; Narayanan, Arvind (2017年4月14日). 「言語コーパスから自動的に得られる意味論には人間のようなバイアスが含まれている」. Science . 356 ( 6334): 183– 186. arXiv : 1608.07187 . Bibcode : 2017Sci...356..183C . doi : 10.1126/science.aal4230 . ISSN 0036-8075 . PMID 28408601. S2CID 23163324 . ^ Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, DD; Sugiyama, M.; Luxburg, UV; Guyon, I. (eds.), "An algorithm for L1 nearest neighbor search via monotonic embedding" (PDF) , Advances in Neural Information Processing Systems 29 , Curran Associates, Inc., pp. 983– 991, archived (PDF) from the original on 7 April 2017 , retrieved 20 August 2018 ^ MOR Prates; PHC Avelar; LC Lamb (2019年3月11日). 「機械翻訳におけるジェンダーバイアスの評価 - Google Translateを用いたケーススタディ」. arXiv : 1809.02208 [ cs.CY ]. ^ Narayanan, Arvind (2016年8月24日). 「言語には必然的に人間のバイアスが含まれており、言語コーパスで訓練された機械にもバイアスが含まれる」 . Freedom to Tinker . 2018年6月25日時点のオリジナルより アーカイブ。 2016年 11月19日 閲覧 。 ^ メッツ、レイチェル(2016年3月24日) 「なぜマイクロソフトは偶然ネオナチ・セックスボットを解き放ったのか」 MIT テクノロジーレビュー 。 2018年11月9日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ ヴィンセント・ジェームズ (2018年1月12日). 「Googleは画像ラベル技術からゴリラを削除することで、人種差別的なアルゴリズムを『修正』した」 The Verge . 2018年8月21日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ Crawford, Kate (2016年6月25日). 「Opinion | Artificial Intelligence's White Guy Problem」 . New York Times . 2021年1月14日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ Simonite, Tom (2017年3月30日). 「Microsoft: AIはまだビジネスを支援するのに十分な適応性がない」 . MIT Technology Review . 2018年11月9日時点のオリジナルより アーカイブ。 2018年 8月20日 閲覧 。 ^ Hempel, Jessi (2018年11月13日). 「フェイフェイ・リーの人類にとってより良い機械を作るための探求」 . Wired . ISSN 1059-1028 . 2020年12月14日時点のオリジナルより アーカイブ。 2019年 2月17日 閲覧 。 ^ Char, DS; Shah, NH; Magnus, D. (2018). 「医療における機械学習の導入:倫理的課題への取り組み」 . New England Journal of Medicine . 378 (11): 981– 983. doi : 10.1056/nejmp1714229 . PMC 5962261. PMID 29539284 . ^ Research, AI (2015年10月23日). 「音声認識における音響モデリングのためのディープニューラルネットワーク」 . airesearch.com . 2016年2月1日時点のオリジナルより アーカイブ 。 2015年 10月23日 閲覧。 ^ 「GPUは今のところAIアクセラレータ市場を引き続き支配している」 InformationWeek 、 2019年12月。 2020年6月10日時点のオリジナルより アーカイブ。 2020年 6月11日 閲覧 。 ^ Ray, Tiernan (2019). 「AIはコンピューティングの本質そのものを変えつつある」 . ZDNet . 2020年5月25日時点のオリジナルより アーカイブ。 2020年 6月11日 閲覧 。 ^ 「AIとコンピューティング」 OpenAI 、2018年5月16日。 2020 年6月17日時点のオリジナルより アーカイブ。 2020年 6月11日 閲覧 。 ^ Jouppi, Norman P.; Young, Cliff; Patil, Nishant; Patterson, David; Agrawal, Gaurav; Bajwa, Raminder; Bates, Sarah; Bhatia, Suresh; Boden, Nan; Borchers, Al; Boyle, Rick; Cantin, Pierre-luc; Chao, Clifford; Clark, Chris; Coriell, Jeremy (2017年6月24日). 「データセンター内におけるTensor Processing Unitのパフォーマンス分析」. 第44回国際コンピュータアーキテクチャシンポジウム論文集 . ISCA '17. ニューヨーク、ニューヨーク州、米国: Association for Computing Machinery. pp. 1– 12. arXiv : 1704.04760 . doi : 10.1145/3079856.3080246 . ISBN 978-1-4503-4892-8 。^ Best, Jo (2020年12月8日). 「ニューロモルフィック・コンピューティングとは何か?それがコンピューティングの未来をどのように変えているのか、知っておくべきことすべて」 . ZDNET . 2024年 11月21日 閲覧 。 ^ Hecate He (2021年5月27日). Michael Sarazen; Chain Zhang (編). 「Cornell & NTT's Physical Neural Networks: A "Radical Alternative for Implementing Deep Neural Networks" That Enables Arbitrary Physical Systems Training」 . Synced . 2021年10月27日時点のオリジナルより アーカイブ。 2021年 10月12日 閲覧 。 ^ Clark, Lindsay (2021年10月5日). 「ナノスパゲッティでニューラルネットワークの電力消費問題を解決」 The Register . 2021年10月6日時点のオリジナルより アーカイブ。 2021年 10月12日 閲覧 。 ^ Fafoutis, Xenofon; Marchegiani, Letizia; Elsts, Atis; Pope, James; Piechocki, Robert; Craddock, Ian (2018年5月7日). 「機械学習を組み込んだウェアラブルセンサーのバッテリー寿命延長」 . 2018 IEEE 第4回世界モノのインターネットフォーラム (WF-IoT) . pp. 269– 274. doi : 10.1109/WF-IoT.2018.8355116 . hdl : 1983/b8fdb58b-7114-45c6-82e4-4ab239c1327f . ISBN 978-1-4673-9944-9 . S2CID 19192912 . 2022年1月18日時点のオリジナルよりアーカイブ 。2022年1月17日 閲覧。^ 「組み込みシステム向け機械学習初心者ガイド」 . Analytics India Magazine . 2021年6月2日. 2022年1月18日時点のオリジナルより アーカイブ。 2022年 1月17日 閲覧 。 ^ Synced (2022年1月12日). 「Google、Purdue、Harvard UのTinyML向けオープンソースフレームワークがFPGAで最大75倍の高速化を実現 | Synced」 . syncedreview.com . 2022年1月18日時点のオリジナルより アーカイブ。 2022年 1月17日 閲覧 。 ^ AlSelek, Mohammad; Alcaraz-Calero, Jose M.; Wang, Qi (2024). 「Dynamic AI-IoT: 超低消費電力5G IoTデバイスにおける更新可能なAIモデルの実現」 . IEEE Internet of Things Journal . 11 (8): 14192– 14205. Bibcode : 2024IITJ...1114192A . doi : 10.1109/JIOT.2023.3340858 . ^ Giri, Davide; Chiu, Kuan-Lin; Di Guglielmo, Giuseppe; Mantovani, Paolo; Carloni, Luca P. (2020年6月15日). 「ESP4ML: 組み込み機械学習向けシステムオンチップのプラットフォームベース設計」 . 2020 Design, Automation & Test in Europe Conference & Exhibition (DATE) . pp. 1049– 1054. arXiv : 2004.03640 . doi : 10.23919/DATE48585.2020.9116317 . ISBN 978-3-9819263-4-7 . S2CID 210928161 . 2022年1月18日時点のオリジナルよりアーカイブ 。2022年1月17日 閲覧。^ Louis, Marcia Sahaya; Azad, Zahra; Delshadtehrani, Leila; Gupta, Suyog; Warden, Pete; Reddi, Vijay Janapa; Joshi, Ajay (2019). 「RISC-V上でTensorFlow Liteを用いたディープラーニングに向けて」 ハーバード 大学 . 2022年1月17日時点のオリジナルより アーカイブ。 2022年 1月17日 閲覧 。 ^ Ibrahim, Ali; Osta, Mario; Alameh, Mohamad; Saleh, Moustafa; Chible, Hussein; Valle, Maurizio (2019年1月21日). 「組み込み機械学習のための近似計算手法」. 2018 第25回 IEEE 国際電子回路・システム会議 (ICECS) . pp. 845– 848. doi : 10.1109/ICECS.2018.8617877 . ISBN 978-1-5386-9562-3 . S2CID 58670712 .^ 「dblp: TensorFlow Eager: 機械学習のためのマルチステージPython埋め込みDSL」 dblp.org . 2022 年1月18日時点のオリジナルより アーカイブ。 2022年 1月17日 閲覧 。 ^ ブランコ、セルジオ;フェレイラ、アンドレ G.ホルヘ州カブラル(2019年11月5日)。 「リソースが不足している組み込みシステム、FPGA、およびエンドデバイスにおける機械学習: 調査」 。 エレクトロニクス 。 8 (11): 1289. 土井 : 10.3390/electronics8111289 。 hdl : 1822/62521 。 ISSN 2079-9292 。
出典
さらに読む
外部リンク