バーチャルアシスタント

Pixel XLスマートフォンで動作するGoogleアシスタント

バーチャルアシスタントVA)は、ユーザーからの指示や質問(音声によるものも含む)などの入力に基づいて、様々なタスクやサービスを実行できるソフトウェアエージェントです。このような技術には、タスク実行を効率化するためにチャットボット機能が組み込まれていることがよくあります。やり取りはテキスト、グラフィカルインターフェース、または音声を介して行われます。一部のバーチャルアシスタントは人間の発話を解釈し、合成音声で応答することができます。

多くの場合、ユーザーは仮想アシスタントに質問したり、ホームオートメーションデバイスやメディア再生を制御したり、電子メール、ToDoリスト、カレンダーなどの基本的なタスクを管理したりすることができます。これらはすべて音声コマンドで行えます。[ 1 ]近年、消費者が直接使用する仮想アシスタントとしては、Apple SiriAmazon AlexaGoogle Assistant (Gemini)Microsoft CopilotSamsung Bixbyなどが有名です。[ 2 ]また、様々な業界の企業が顧客サービスやサポートに何らかの仮想アシスタント技術を取り入れているケースも少なくありません。[ 3 ]

2020年代には、 ChatGPTなどの人工知能ベースのチャットボットの出現により、仮想アシスタント製品とサービスの分野の機能と関心が高まりました。[ 4 ] [ 5 ] [ 6 ]

歴史

実験の時代:1910年代~1980年代

ラジオレックスは、1916年に特許を取得し[ 7 ]、1922年に発売された最初の音声起動玩具でした[ 8 ]。それは犬の形をした木製の玩具で、名前を呼ぶと家から出てくるものでした。

1952年、ベル研究所は自動数字認識装置「オードリー」を発表しました。高さ6フィートのリレーラックを占有し、かなりの電力を消費し、ケーブルが多数配線され、複雑な真空管回路に伴うメンテナンス上の問題が山積していました。音声の基本単位である音素を認識できましたが、特定の話者が発した数字を正確に認識することしかできませんでした。そのため、音声ダイヤルにも使用できましたが、ほとんどの場合、連続した数字を音声で読み上げるよりも、プッシュボタンによるダイヤルの方が安価で高速でした。[ 9 ]

デジタル音声認識を実行できる初期のツールとしては、IBM シューボックス音声起動計算機が挙げられます。これは 1961 年に初めて市場に投入された後、1962 年のシアトル万国博覧会で一般に公開されました。この初期のコンピュータは、1981 年に最初のIBM パーソナルコンピュータが導入される約 20 年前に開発され、16 の音声単語と 0 から 9 までの数字を認識することができました。

最初の自然言語処理コンピュータプログラム、あるいはチャットボットであるELIZAは、1960年代にMITのジョセフ・ワイゼンバウム教授によって開発されました。これは「人間と機械の間のコミュニケーションが表面的なものに過ぎないことを示す」ために作られました。[ 10 ] ELIZAは、パターンマッチングと置換手法を用いてスクリプト化された応答をシミュレートし、会話を模倣することで、プログラムが理解しているという錯覚を生じさせました。

ワイゼンバウムの秘書は、エリザと本当の会話をするために、ワイゼンバウムに部屋から出て行くように頼んだと伝えられている。ワイゼンバウムはこれに驚き、後にこう記している。「比較的単純なコンピュータプログラムにごく短時間触れるだけで、ごく普通の人間に強力な妄想的思考を引き起こすことができるとは、私は知らなかった。」[ 11 ]

このことから、エリザ効果、つまり、コンピューターの動作が人間の動作に類似していると無意識に想定する傾向、つまり擬人化という、人間と仮想アシスタントとのやりとりで見られる現象が生まれました。

音声認識技術開発における次のマイルストーンは、1970年代にペンシルベニア州ピッツバーグカーネギーメロン大学で達成されました。これは、米国国防総省とその傘下の国防高等研究計画局(DARPA)の多大な支援を受けて、5年間にわたる音声理解研究プログラムが資金提供を受けた結果です。このプログラムは、最低1,000語の語彙の習得を目指していました。IBM、カーネギーメロン大学(CMU)、スタンフォード研究所などの企業や学界がこのプログラムに参加しました。

その結果生まれたのが「ハーピー」です。3歳児の語彙に相当する約1000語を習得し、文章を理解できるようになりました。事前にプログラムされた語彙、発音、文法構造に基づいた音声を処理し、どの単語の並びが意味を成すかを判断し、音声認識の誤りを減らすことができました。

1986年、Shoeboxのアップグレード版として登場したTangoraは、音声認識タイプライターでした。当時世界最速のタイピストにちなんで名付けられたこのタイプライターは、2万語の語彙を誇り、過去の発言内容に基づいて最も可能性の高い結果を予測していました。IBMのアプローチは、デジタル信号処理技術に統計学を加える隠れマルコフモデルに基づいていました。この手法により、特定の音素に続く可能性の高い音素を予測することが可能になりました。それでもなお、各話者は自分の声を認識し、単語間の休止を入れるよう、タイプライターを個別にトレーニングする必要がありました。

1983年、ガス・サーシーは電子音声ホームコントローラーシステム「Butler In A Box」を発明した。[ 12 ]

スマートバーチャルアシスタントの誕生:1990年代~2010年代

1990年代には、デジタル音声認識技術がパーソナルコンピュータの機能として定着し、IBMPhilips、そ​​してLernout & Hauspieが顧客獲得を競い合いました。それからずっと後、1994年に最初のスマートフォンであるIBM Simonが発売され、今日私たちが知っているようなスマートバーチャルアシスタントの基礎が築かれました。

1997年、Dragon社のNaturallySpeakingソフトウェアは、自然な人間の発話を単語間の間を置かずに認識し、毎分100語の速度で文書に書き起こすことができました。NaturallySpeakingのバージョンは現在でもダウンロード可能で、例えば米国や英国では多くの医師が医療記録の作成に利用しています。

2001年、コロキスはAIMMSNメッセンジャーなどのプラットフォーム上でSmarterChildを公開しました。SmarterChildは完全にテキストベースでしたが、ゲームをしたり、天気を確認したり、情報を調べたり、ある程度ユーザーと会話したりすることができました。[ 13 ]

スマートフォンに搭載された最初の現代的なデジタル仮想アシスタントはSiriで、 2011年10月4日にiPhone 4Sの機能として導入されました。[ 14 ] Apple社はDARPA米国防総省が出資する研究機関であるSRI Internationalスピンオフ企業であるSiri Inc.を2010年に買収した後、Siriを開発しました。[ 15 ] Siriの目的は、テキストメッセージの送信、電話の発信、天気の確認、アラームの設定などのタスクを支援することでした。時が経つにつれて、Siriはレストランのおすすめ、インターネット検索、運転ルート案内などに進化しました。[ 16 ]

2014年11月、AmazonはEchoと合わせてAlexaを発表しました。[ 17 ] 2016年、SalesforceはSalesforceプラットフォームの基盤となる技術群から開発されたEinsteinを発表しました。[ 18 ] Einsteinは2024年9月にエージェントAIであるAgentforceに置き換えられました。 [ 19 ]

2017 年 4 月、Amazon はあらゆる種類の仮想アシスタントやインターフェース向けの 会話型インターフェースを構築するためのサービスをリリースしました。

大規模言語モデル:2020年代現在

2020年代には、ChatGPTのような人工知能(AI)システムが、テキストベースの会話に対して人間のような応答を生成する能力により人気を集めました。2020年2月、マイクロソフトはチューリング自然言語生成(T-NLG)を発表しました。これは当時「170億のパラメータを持つ史上最大の言語モデル」でした。[ 20 ] 2022年11月30日、ChatGPTはプロトタイプとしてリリースされ、多くの知識領域にわたる詳細な応答と明確な回答ですぐに注目を集めました。ChatGPTの登場と一般への導入により、この分野への関心と競争が高まりました。2023年2月、Googleは「Bard」と呼ばれる実験的なサービスの導入を開始しました。これは、Webから収集した情報に基づいて質問に対するテキスト応答を生成するLaMDAプログラムに基づいています。

ChatGPTや最新の生成AIをベースにした他の汎用チャットボットは、仮想アシスタントに関連するさまざまなタスクを実行できますが、より具体的な状況やニーズをターゲットにするように設計された、より特化した形式の技術も存在します。[ 21 ] [ 4 ]

相互作用の方法

Alexa仮想アシスタントを搭載したAmazon Echo Dotスマートスピーカー

仮想アシスタントは以下を介して動作します。

多くの仮想アシスタントは複数の方法でアクセス可能であり、チャット、音声コマンド、その他の統合テクノロジーなど、ユーザーが仮想アシスタントと対話できる方法に多様性を提供します。

バーチャルアシスタントは、自然言語処理(NLP)を用いて、ユーザーのテキストまたは音声入力を実行可能なコマンドと照合します。機械学習環境知能などの人工知能技術を用いて継続的に学習するものもあります。

音声でバーチャルアシスタントを起動するには、ウェイクワードが使用される場合があります。これは、「Hey Siri」「OK Google」「Hey Google」「Alexa」「Hey Microsoft」といった単語、または複数の単語の組み合わせです。[ 24 ]バーチャルアシスタントの人気が高まるにつれて、法的リスクが高まっています。[ 25 ] : 815

デバイスとオブジェクト

Apple TVのリモコン。ユーザーはこれを使って、仮想アシスタントSiriに視聴するコンテンツを探すよう頼むことができる。

仮想アシスタントは、多くの種類のプラットフォームに統合されるか、Amazon Alexa のように複数のプラットフォームにまたがって統合される可能性があります。

サービス

バーチャルアシスタントは多種多様なサービスを提供できます。これには以下が含まれます。[ 33 ]

会話型コマース

会話型コマースとは、音声アシスタント[ 36 ]だけでなく、電子商取引ウェブサイト上のライブチャット、WeChat、Facebook Messenger、WhatsAppなどのメッセージングアプリケーション上のライブチャット[ 37 ] メッセージングアプリケーションウェブサイト上のチャットボットなど、さまざまなメッセージング手段を介した電子商取引のことです。

カスタマーサポート

バーチャルアシスタントは、企業のカスタマーサポートチームと連携して、顧客に24時間365日のサポートを提供できます。迅速な対応により、顧客体験が向上します。サービス業界の企業は、予約や注文受付といった日常的な顧客対応、特に営業時間外の対応にAI音声アシスタントを導入しています。[ 38 ]これらの導入では、業界特有の専門用語の理解や既存のビジネスソフトウェアとの統合のために、業界特有のトレーニングがしばしば活用されています。

サードパーティのサービス

Amazon は、基本的にアシスタント プラットフォーム上で実行されるアプリケーションである Alexa「スキル」と Google「アクション」を有効にします。

プライバシー

バーチャルアシスタントには、プライバシーに関する様々な懸念が伴います。音声による起動などの機能は、デバイスが常に音声を聞き取っている必要があるため、脅威となります。[ 39 ]バーチャルアシスタントのための多層認証を実現するために、バーチャルセキュリティボタンなどのプライバシー保護モードが提案されています。[ 40 ]

Googleアシスタント

Googleアシスタントのプライバシーポリシーでは、ユーザーの許可なく音声データを保存することはないが、ユーザーエクスペリエンスをパーソナライズするために会話の記録を保存する場合があると規定されています。パーソナライズは設定でオフにすることができます。Googleアシスタントに音声データを保存させたい場合は、「音声アクティビティ(VAA)」でこの機能をオンにしてください。音声ファイルはクラウドに送信され、Googleアシスタントのパフォーマンス向上のために使用されますが、VAA機能がオンになっている場合に限られます。[ 41 ]

アマゾンアレクサ

AmazonのバーチャルアシスタントAlexaのプライバシーポリシーでは、Alexaはウェイクワード(Alexa、Amazon、Echoなど)が使われた場合にのみ会話を聞き取ると規定されています。ウェイクワードの発声後、会話の録音を開始し、8秒間の沈黙後に録音を停止します。録音された会話はクラウドに送信されます。「Alexa」アプリの「Alexaプライバシー」にアクセスすることで、クラウドから録音データを削除できます。[ 42 ]

アップルシリ

Appleは、Siriの性能向上のために音声を録音することはないと述べています。代わりに、トランスクリプトを使用していると主張しています。トランスクリプトデータは、分析に重要と判断された場合にのみ送信されます。ユーザーは、Siriがトランスクリプトをクラウドに送信することを望まない場合、いつでもオプトアウトできます。[ 43 ]

マイクロソフト コルタナ

Cortanaは、単一の認証を備えた音声のみの仮想アシスタントです。[ 44 ] [ 45 ] [ 46 ]この音声起動デバイスは、天気の確認や電話をかけるなどの一般的なタスクを実行するためにユーザーデータにアクセスしますが、二次認証がないためプライバシーに関する懸念が生じます。[ 47 ] [ 48 ]

消費者の関心

新たな交流方法を可能にするという付加価値を想定

仮想アシスタントの付加価値は、主に次のようなものから生まれます。

  1. これは便利です。音声が唯一のコミュニケーション手段である分野もありますが、より一般的には、両手と視覚を自由に使えるようになるため、並行して別の作業を行うことができるほか、障害を持つ人にも役立ちます。
  2. より速い:音声入力はキーボード入力よりも効率的です。キーボード入力の場合は1分間に60語ですが、音声入力では最大200語まで可能です。また、より自然なため、労力も少なくて済みます(ただし、テキストを読む場合は1分間に700語に達することもあります)。[ 49 ]
  • バーチャルアシスタントは自動化によって多くの時間を節約します。例えば、消費者が他の作業をしている間に、予約を取ったりニュースを読んだりできます。また、バーチャルアシスタントに会議のスケジュールを依頼して、時間管理を支援することも可能になります。新しいデジタルスケジューラーの設計者は、これらのカレンダーが機械学習プロセスを通じて消費者の時間をより効率的に活用できるように、仕事の時間と自由時間を完全に管理し、生活をスケジュールするという野望を説明しました。例えば、消費者が休憩を取りたいと希望すると、VAは最適なタイミング(例えば、生産性が低い週の時間帯)で休憩をスケジュールします。さらに、消費者の自由時間をスケジュールし、管理することで、最適な仕事効率を確保するという長期的な目標もあります。[ 50 ]

認識された関心

消費者がバーチャルアシスタントに興味を持つ理由を捉えた調査のグラフによる要約
  • 最近の調査(2019年)によると、消費者がバーチャルアシスタントを利用する理由は、有用性の認識と楽しさの認識の2つです。この調査の第一の結論は、有用性の認識と楽しさの認識はどちらも、消費者のバーチャルアシスタント利用意欲に同等に非常に強い影響を与えるということです。
  • この研究の2番目の結果は次のとおりです。
  1. 提供されるコンテンツの品質は、有用性の認識に非常に大きな影響を与え、楽しさの認識にも大きな影響を与えます。
  2. 視覚的な魅力は、知覚される楽しさに非常に強い影響を与えます。
  3. 自動化は有用性の認識に強い影響を与える。[ 51 ]

論争

人工知能をめぐる論争

  • バーチャルアシスタントはフィルターバブルを促進する:ソーシャルメディアにおいて、バーチャルアシスタントのアルゴリズムは、消費者の過去の行動に基づいて関連データを表示し、それ以外のデータを破棄するように訓練されている。関連データとは、消費者の興味を引く、あるいは満足させるデータである。その結果、消費者は自分の見解に反するデータから隔離され、事実上、独自の知的バブルに閉じこもり、自らの意見を強化する。この現象は、フェイクニュースエコーチェンバーを強化することが知られている。[ 52 ]
  • バーチャルアシスタントは過大評価されていると批判されることもあります。特にA. カシリ氏は、バーチャルアシスタントのAIは知的でも人工的でもないと指摘しています。その理由は以下の2つです。
  1. バーチャルアシスタントは人間のアシスタントとして、人間が容易に実行できるタスク、つまり情報、オファー、文書の検索、分類、提示といった非常に限定された範囲でのみ実行するため、知性があるとは言えません。また、バーチャルアシスタントは自ら判断を下すことも、物事を予測することもできません。
  2. そして、それらは人工的なものではない。なぜなら、微細な作業による人間のラベル付けなしには不可能だからである。[ 53 ]
  • バーチャルアシスタントは、典型的には女性的な声やペルソナをデフォルトとするため、ジェンダーロールに関する論争も引き起こしています。J. リンゲルとK. クロフォードは、バーチャルアシスタントは秘書という文化的人物像を想起させ、支援的で有能で女性的な従属的役割を体現していると主張しています。 [ 54 ]この設計上の選択は、誰の利益が優先されるかを反映した階層的な権力構造に役立っています。歴史的に、秘書の役割は女性にとって終着点であり、男性はそれをキャリアアップに活用することができました。[ 55 ]したがって、この論争は、女性の労働と関連付けられると仕事の価値が下がるという、より広範な懸念につながっています。[ 56 ]

倫理的な意味合い

2019年にフランスの社会学者アントニオ・A・カシリは、特に人工知能、バーチャルアシスタントを次のように批判した。

第一に、消費者が多くの場合知らずに、仮想アシスタントのトレーニングと改善のために無料のデータを提供しているという事実は、倫理的に問題があります。

しかし、第二レベルでは、これらのAI がこのデータを使って どのようにトレーニングされるかを知ることは、倫理的にさらに不安なことかもしれません。

この人工知能はニューラルネットワークで学習され、膨大な量のラベル付きデータを必要とする。しかし、このデータは人間のプロセスでラベル付けされる必要があり、これが過去10年間のマイクロワークの増加の理由である。つまり、世界中の何人かの人間を遠隔で利用し、仮想アシスタントの音声データを聞き、言われたことを書き留めるなど、数セントでいくつかの反復的で非常に単純なタスクを実行することである。マイクロワークは、それがもたらす雇用の不安定さと、規制がまったくないことで批判されてきた。2010年の平均時給は1.38ドルで、 [ 57 ]医療保険も退職金も病気手当最低賃金も提供されていない。したがって、仮想アシスタントとその設計者は雇用の不安定さを助長するとして物議を醸しており、彼らが提案するAIは何百万人もの人間の労働者のマイクロワークなしでは不可能であるという点で依然として人間的である。[ 53 ]

音声コマンドは暗号化されていない形式で仮想アシスタントプロバイダーに提供され、第三者と共有され、不正または予期しない方法で処理される可能性があるため、プライバシーに関する懸念が生じています。[ 58 ]録音された音声の言語コンテンツに加えて、ユーザーの表現方法や音声特性には、生体認証、性格特性、体型、身体的および精神的健康状態、性別、ジェンダー、気分や感情、社会経済的地位、地理的起源に関する情報が暗黙的に含まれている可能性があります。[ 59 ]

バーチャルアシスタントの女性化

Siri、Cortana、Alexaといったバーチャルアシスタントの多くは、デフォルトで女性的な声とペルソナを備えており、秘書業務における労働政治の問題に注目を集めています。これらのバーチャルアシスタントの声の女性化は、女性の仕事に対する根深いジェンダーバイアスへの懸念を提起し、ユーザーが彼らと交流する際に女性の従属的なイメージを強めてしまいます。バーチャル秘書であるこれらのアシスタントは、秘書は女性的でサポート的で威圧感のないサービス業務というジェンダーに基づくステレオタイプと結びついています。[ 60 ]

研究者たちは、バーチャルアシスタントの女性化された声に注目し、テクノロジーにおけるジェンダーに基づく問題に取り組んでいます。ジェンダーバイアスのあるテクノロジーは、女性の客体化やジェンダーステレオタイプ化を強め、ジェンダーギャップを拡大する可能性があるため、これは興味深い問題です。さらに、無意識の偏見が子供や大人に現れ、女性を命令する傾向が強くなるため、性差別的な物語を助長する懸念もあります。[ 61 ]

開発者プラットフォーム

注目すべき仮想アシスタントの開発プラットフォームには次のようなものがあります。

以前の世代

以前の世代のテキスト チャット ベースの仮想アシスタントでは、アシスタントは多くの場合アバター(対話型オンライン キャラクターまたは自動化キャラクターとも呼ばれる) によって表現されていました。これは、具現化エージェントと呼ばれていました。

経済的関連性

個人向け

バーチャルアシスタントによって可能になるデジタル体験は、最近の主要な技術進歩と最も有望な消費者動向の1つと考えられています。専門家は、デジタル体験は「実際の」体験に匹敵するステータスの重みを獲得し、さらに求められ、高く評価されるようになると主張しています。[ 66 ]この傾向は、多数の常連ユーザーと、バーチャルデジタルアシスタントの世界的なユーザー数の大幅な増加によって裏付けられています。2017年半ばの時点で、デジタルバーチャルアシスタントの常連ユーザー数は世界中で約10億人と推定されています。[ 67 ]さらに、バーチャルデジタルアシスタント技術はスマートフォンのアプリケーションに限定されず、多くの産業分野(自動車、通信、小売、ヘルスケア、教育など)に存在していることがわかります。[ 68 ] あらゆる分野の企業による多額の研究開発費とモバイルデバイスの導入増加を受けて、音声認識技術市場は2016年から2024年にかけて世界全体で年平均成長率34.9%で成長し、2024年までに世界市場規模75億米ドルを超えると予測されています。 [ 68 ] Ovumの調査によると、「ネイティブデジタルアシスタントのインストールベース」は2021年までに世界人口を超え、アクティブな音声AI対応デバイスは75億台に達すると予測されています。[ 69 ] Ovumによると、その頃には「Googleアシスタントが音声AI対応デバイス市場で23.3%のシェアでトップに立ち、次いでSamsungのBixby(14.5%)、AppleのSiri(13.1%)、AmazonのAlexa(3.9%)、MicrosoftのCortana(2.3%)が続く」とされています。[ 69 ]

市場リーダーの地域分布を考慮すると、 BYOD( Bring Your Own Device )とエンタープライズモビリティビジネスモデルの大きな影響により、北米企業(例: Nuance CommunicationsIBMeGain )が今後数年間で業界を支配すると予想されます。さらに、スマートフォン支援プラットフォームの需要増加により、北米のインテリジェント仮想アシスタント(IVA)業界の成長がさらに促進されると予想されます。北米市場と比較すると規模は小さいものの、主要プレーヤーがインドと中国に拠点を置くアジア太平洋地域のインテリジェント仮想アシスタント業界は、2016年から2024年にかけて年間成長率40%(世界平均を上回る)で成長すると予測されています。[ 68 ]

企業にとっての経済的機会

バーチャルアシスタントは、個人向けのガジェットとしてだけでなく、企業にとって真の経済的有用性を持つ可能性があります。例えば、バーチャルアシスタントは、百科事典のような知識を持つ、いつでも利用可能なアシスタントの役割を果たすことができます。会議の企画、在庫の確認、情報の検証などを行うことができます。バーチャルアシスタントは、中小企業への導入が、モノのインターネット(IoT)のよりグローバルな導入と活用という、容易な第一歩となることが多いため、ますます重要になっています。実際、IoT技術は、中小企業にとって、極めて重要な技術でありながら、複雑すぎたり、リスクが高すぎたり、コストがかかりすぎたりするものとして認識されています。[ 70 ]

安全

2018年5月、カリフォルニア大学バークレー校の研究者らは、人間の耳には聞こえない音声コマンドを音楽や音声テキストに直接埋め込むことで、ユーザーが気づかないうちにバーチャルアシスタントに特定のアクションを実行させることができるという論文を発表した。[ 71 ]研究者らは音声ファイルに小さな変更を加え、音声認識システムが検出することになっている音声パターンをキャンセルした。これらの音声パターンは、システムによって異なる解釈がなされる音に置き換えられ、電話番号のダイヤル、ウェブサイトの閲覧、さらには送金まで指示されるようになった。[ 71 ]この可能性は2016年から知られており、[ 71 ] Apple、Amazon、Googleのデバイスに影響を与えている。[ 72 ]

意図しない操作や音声録音に加えて、インテリジェント仮想アシスタントに関連するセキュリティとプライバシーのリスクとして、悪意のある音声コマンドがあります。攻撃者はユーザーになりすまして悪意のある音声コマンドを発行し、例えばスマートドアのロックを解除して自宅やガレージに不正に侵入したり、ユーザーに知られずにオンラインで商品を注文したりします。一部のIVAはこのようななりすましを防ぐために音声トレーニング機能を提供していますが、システムが類似した音声を区別することが困難な場合があります。そのため、IVA対応デバイスにアクセスできる悪意のある人物は、システムを騙して自分が本当の所有者であると信じ込ませ、犯罪行為やいたずら行為を行う可能性があります。[ 73 ]

著名なアシスタントの比較

インテリジェントなパーソナルアシスタント 開発者 フリーソフトウェア無料のオープンソースハードウェアHDMI出力 外部I/O IoTChromecast統合 スマートフォンアプリ 常にオン ユニット間音声チャネル スキル言語
Alexa(別名EchoAmazon.comいいえ いいえ いいえ いいえ はい いいえ はい はい ? JavaScript
アリスヤンデックスいいえ 該当なし該当なし該当なしはい いいえ はい はい 該当なし?
アリジェニーアリババグループいいえ いいえ 該当なし該当なしはい いいえ はい はい 該当なし?
アシスタントスピークトイットいいえ 該当なし該当なし該当なしいいえ いいえ はい いいえ 該当なし?
ビクスビーサムスン電子いいえ 該当なし該当なし該当なしいいえ いいえ はい 該当なし該当なしJavaScript
ブラックベリーアシスタントブラックベリーリミテッドいいえ 該当なし該当なし該当なしいいえ いいえ はい いいえ 該当なし?
ブレイナブレイナソフト いいえ 該当なし該当なし該当なしいいえ いいえ はい いいえ 該当なし?
クローバネイバー株式会社いいえ 該当なし該当なし該当なしはい いいえ はい はい 該当なし?
コルタナマイクロソフトいいえ 該当なし該当なし該当なしはい いいえ はい はい 該当なし?
デューアー百度[ 74 ]
エヴィAmazon.com真の知識いいえ 該当なし該当なし該当なしいいえ いいえ はい いいえ 該当なし?
Googleアシスタントグーグルいいえ 該当なし該当なし該当なしはい はい はい はい 該当なしC++
Google Nowグーグルいいえ 該当なし該当なし該当なしはい はい はい はい 該当なし?
マイクロフト[ 75 ]マイクロフトAI はい はい はい はい はい はい はい はい はい パイソン
シルビア認知コード いいえ 該当なし該当なし該当なしいいえ いいえ はい いいえ 該当なし?
シリアップル社いいえ いいえ 該当なし該当なしはい いいえ はい はい 該当なし?
ヴィヴサムスン電子いいえ 該当なし該当なし該当なしはい いいえ はい いいえ 該当なし?
小薇テンセント?
セリアファーウェイいいえ いいえ 該当なし該当なしはい いいえ はい はい 該当なし?

参照

参考文献

  1. ^ Hoy, Matthew B. (2018). 「Alexa、Siri、Cortanaなど:音声アシスタント入門」. Medical Reference Services Quarterly . 37 (1): 81– 88. doi : 10.1080/02763869.2018.1404391 . PMID  29327988. S2CID  30809087 .
  2. ^ 「Siri vs Alexa vs Google Assistant vs Bixby:どれが最強か?」 Android Authority、2024年1月29日。
  3. ^ 「バーチャルアシスタントの魔法と顧客サービスへの影響」
  4. ^ a b「AIチャットボットを絶対に活用すべき1つのこと」 2023年4月7日。
  5. ^ 「AIは誰もが『ホワイトカラー』のパーソナルアシスタントを持つことを意味する、とビル・ゲイツ氏は語る」
  6. ^ 「Chat GPT:それは何ですか?」 uca.edu 2024年2月8閲覧
  7. ^ US 1209636、クリスチャン・バーガー、「音響作動回路制御装置」、1916年12月19日発行、潜水艦無線会社に配属 
  8. ^マーコウィッツ、ジュディス。「声を持つおもちゃSpeechTechMag
  9. ^モスクヴィッチ、カティア(2017年2月15日)「聞くことを学んだ機械」 BBC 。 2020年5月5日閲覧
  10. ^ Epstein, J; Klinkenberg, W. D (2001年5月1日). 「Elizaからインターネットへ:コンピュータによる評価の簡潔な歴史」 . Computers in Human Behavior . 17 (3): 295– 314. doi : 10.1016/S0747-5632(01)00004-8 . ISSN 0747-5632 . 
  11. ^ワイゼンバウム、ジョセフ (1976). 「コンピュータのパワーと人間の理性:判断から計算へ」オリバー・ウェンデル・ホームズ図書館、フィリップス・アカデミー、サンフランシスコ:WHフリーマン。
  12. ^ 「1983年の15,000ドルのAI」YouTube2024年3月6日。
  13. ^ “スマートフォン:あなたの新しいパーソナルアシスタント - Orange Pop” . 2017年7月10日. 2017年7月10日時点のオリジナルよりアーカイブ2020年5月5日閲覧。
  14. ^ダレン、マーフ (2011 年 10 月 4 日)。「iPhone 4Sハンズオン!」。 Engadget.com 2017 年12 月 10 日に取得
  15. ^ “特集: IBM Shoebox bis Siri: 50 Jahre Spracherkennung – WELT” [IBM Shoebox から Siri まで: 音声認識の 50 年]。Die Welt (ドイツ語)。 Welt.de. 2012 年 4 月 20 日2017 年12 月 10 日に取得
  16. ^ Cipriani, Jason; Jacobsson Purewal, Sarah (2017年11月27日). 「Siriコマンドの完全リスト」 . CNET . 2025年8月7日閲覧
  17. ^ Kundu, Kishalaya (2023). 「Amazon、新型スマートスピーカー、イヤホンなどでEchoラインナップを拡大」 XDA . 2023年5月26日閲覧
  18. ^ Miller, Ron (2016年9月18日). 「Salesforce Einstein、Salesforceプラットフォーム全体に人工知能を提供」 . TechCrunch . 2025年8月7日閲覧
  19. ^ Schmeiser, Lisa; Vartabedian, Matt (2024年9月12日). 「Salesforce、Einsteinの後継機Agentforceを発表」 www.nojitter.com . 2025年8月7日閲覧
  20. ^ Sterling, Bruce (2020年2月13日). 「Webセマンティクス:Microsoft Project TuringがTuring自然言語生成(T-NLG)を導入」 . Wired . ISSN 1059-1028 . 2020年7月31日閲覧 
  21. ^ Gupta, Aman (2023年3月21日). 「GPT-4が世界を席巻 ― チャットボットを導入した企業リストmint .
  22. ^ 「Conversica、ビジネス向け会話型AIの拡大に向けシリーズC資金調達で3100万ドルを調達」 Bloomberg.com 2018年10月30日。 2020年10月23日閲覧
  23. ^ Herrera, Sebastian (2019年9月26日). 「Amazon、Alexaのリーチをウェアラブルデバイスに拡大」 .ウォール・ストリート・ジャーナル. 2019年9月26日閲覧
  24. ^ 「S7617 – AlexaやOK Googleのような独自のウェイクワードエンジンを開発する」 GPUテクノロジーカンファレンス」。2020年11月30日時点のオリジナルよりアーカイブ。2017年7月17日閲覧。
  25. ^ Van Loo, Rory (2019年3月1日). 「デジタル市場の完全性」 .ミシガン法レビュー. 117 (5): 815. doi : 10.36644/mlr.117.5.digital . S2CID 86402702 . 
  26. ^ La, Lynn (2017年2月27日). 「PixelでGoogleアシスタントができることすべて」 . CNET . 2017年12月10日閲覧
  27. ^ Morrison, Maureen (2014年10月5日). 「Domino's、ファーストフード業界に音声注文アプリを導入 | CMO Strategy」 . AdAge . 2017年12月10日閲覧
  28. ^ O'Shea, Dan (2017年1月4日). 「LG、Amazon Alexa対応の食料品注文機能を搭載したスマート冷蔵庫を発表」 Retail Dive . 2017年12月10日閲覧
  29. ^ギブス、サミュエル(2017年2月7日)「AmazonのAlexaがEchoを脱出し、自動車に乗り込む|テクノロジー」ガーディアン紙2017年12月10日閲覧
  30. ^ 「Googleアシスタントとは何か、どのように機能するのか、そしてどのデバイスで利用できるのか?」 Pocket-lint、2017年10月6日。 2017年12月10日閲覧
  31. ^ "「『ジェンに聞いてみよう』アラスカ航空のウェブサイト」アラスカ航空、2017年1月2日。 2017年12月10日閲覧
  32. ^ AT&T Tech Channel (2013年6月26日). 「アメリカン航空(USエアウェイズ) – 米国航空会社として初めて自然言語音声認識を導入」(動画), Nuance Enterprise on YouTube . 2021年12月21日時点のオリジナルよりアーカイブ。 2017年12月10日閲覧– YouTube経由。YouTubeタイトル: 航空会社情報システム、1989 – AT&Tアーカイブ – 音声認識
  33. ^ Martin, Taylor; Priest, David (2017年9月10日). 「Alexaコマンドの完全リスト」 . CNET . 2017年12月10日閲覧
  34. ^ Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (2009年1月1日). 「会話エージェントに基づくオンラインヘルプデスクシステムの実装」.国際会議「新興デジタルエコシステム管理に関する国際会議」MEDES '09. ニューヨーク、ニューヨーク州、米国: ACM. pp. 69:450–69:451. doi : 10.1145/1643823.1643908 . ISBN 9781605588292. S2CID  1046438 .
  35. ^ O'Donnell, Anthony (2010年6月3日). 「Aetnaの新しい「バーチャルオンラインアシスタント」保険とテクノロジー」。 2010年6月7日時点のオリジナルよりアーカイブ。
  36. ^ 「会話型コマースに向けて製品とブランドを準備する方法」 VentureBeat 2018年3月6日。
  37. ^テイラー、グレン(2018年3月5日)「小売業の大きなチャンス:米国消費者の87%が会話型コマースの力を理解する - Retail TouchPoints
  38. ^ Anvoa. 「セントラルフロリダのスタートアップ企業、人間並みのAI音声受付サービスで不在着信を収益に変える」 PRLog . 2026年1月17日閲覧
  39. ^ Zhang, Guoming; Yan, Chen; Ji, Xiaoyu; Zhang, Tianchen; Zhang, Taimin; Xu, Wenyuan (2017). 「DolphinAttack」. 2017 ACM SIGSAC コンピュータおよび通信セキュリティ会議 - CCS '17 議事録. pp.  103– 117. arXiv : 1708.09537 . doi : 10.1145/3133956.3134052 . ISBN 9781450349468. S2CID  2419970 .
  40. ^ Lei, Xinyu; Tu, Guan-Hua; Liu, Alex X.; Li, Chi-Yu; Xie, Tian (2017). 「家庭用デジタル音声アシスタントのセキュリティの脆弱性 ― Amazon Alexaを事例として」arXiv : 1712.03327 [ cs.CR ].
  41. ^ 「アシスタントでプライバシー保護を強化」 Google 2019年9月23日2020年2月27日閲覧
  42. ^ 「Alexa、Echoデバイス、そしてあなたのプライバシー」 Amazon.com 20202月27日閲覧
  43. ^ 「Siriのプライバシー保護を強化」 Apple Newsroom 2020年2月27日閲覧
  44. ^ソーパー、マーク・エドワード(2015年8月20日)『Easy Windows 10』アディソン・ウェズリー社、ISBN 978-0-13-407753-6
  45. ^ロペス, グスタボ; ケサダ, ルイス; ゲレーロ, ルイス A. (2018). 「Alexa vs. Siri vs. Cortana vs. Google Assistant: 音声ベースの自然ユーザーインターフェースの比較」 . イザベル L. ヌネス編. 『人間工学とシステムインタラクションの進歩』 . 『インテリジェントシステムとコンピューティングの進歩』 第592巻. シュプリンガー・インターナショナル・パブリッシング. pp.  241– 250. doi : 10.1007/978-3-319-60366-7_23 . hdl : 10669/74729 . ISBN 978-3-319-60366-7
  46. ^ 「AIチャットボットによる顧客ケア」 lucidgen.com 2023年4月25日2024年10月14日閲覧
  47. ^ 「Cortana のサポート終了 - Microsoft サポート」support.microsoft.com . 2024年10月14日閲覧
  48. ^ Forrest, Conner (2015年8月4日). 「Windows 10はデフォルトでプライバシーを侵害する。自分を守る方法はこちら」 . TechRepublic . 2024年10月14日閲覧
  49. ^ミンカー、W.ニール、F. (2002)。「音声技術の開発」ル・トラヴァイユ・ヒューマン65 (3): 261.土井: 10.3917/th.653.0261ISSN 0041-1868 
  50. ^ Wajcman, Judy (2019). 「時間管理のデジタルアーキテクチャ」(PDF) .科学技術と人間の価値. 44 (2): 315– 337. doi : 10.1177/0162243918795041 . S2CID 149648777 . 
  51. ^ Yang, Heetae; Lee, Hwansoo (2018年6月26日). 「仮想パーソナルアシスタントデバイスのユーザー行動の理解」.情報システムとEビジネスマネジメント. 17 (1): 65– 87. doi : 10.1007/s10257-018-0375-1 . ISSN 1617-9846 . S2CID 56838915 .  
  52. ^セルジュ・ティセロン (2019). 「ラ・ファミーユ・スー・エクート」。レコール・デ・ペアレンツ632 (3): 16–18 .土井: 10.3917/epar.632.0016ISSN 0424-2238S2CID 199344092  
  53. ^ a bカシーリ、アントニオ A. (2019).ロボットの従者。トラブルシューティングに関する質問。エディションズ・セイル。ISBN 978-2-02-140188-2. OCLC  1083583353 .
  54. ^リンゲル、ジェッサ、クロフォード、ケイト(2020年5月15日)。「アレクサ、あなたのお母さんについて教えて」:秘書の歴史と秘密主義の終焉カタリスト:フェミニズム、理論、テクノサイエンス。6 ( 1 ) : 1. doi : 10.28968/cftt.v6i1.29949。ISSN 2380-3312 
  55. ^リンゲル、ジェッサ、クロフォード、ケイト(2020年5月15日)。「アレクサ、あなたのお母さんについて教えて」:秘書の歴史と秘密主義の終焉カタリスト:フェミニズム、理論、テクノサイエンス。6 ( 1 ) : 7. doi : 10.28968/cftt.v6i1.29949。ISSN 2380-3312 
  56. ^マルバニー、ケリー(2013年6月20日)「価値あること:資本主義における「女性の仕事」の持続的な価値低下の検証とフェミニスト政治への考察」ジェンダー5 ( 2): 9-10 . doi : 10.3224/gender .
  57. ^ホートン、ジョン・ジョセフ、チルトン、リディア・B. (2010). 「有償クラウドソーシングの労働経済学」.第11回ACM電子商取引会議議事録. EC '10. ニューヨーク、ニューヨーク、アメリカ合衆国: ACM Press. pp.  209– 218. arXiv : 1001.0627 . doi : 10.1145/1807342.1807376 . ISBN 978-1-60558-822-3. S2CID  18237602 .
  58. ^ 「Apple、Google、Amazonがデジタルアシスタントのコマンドを見直し、プライバシーを侵害した可能性がある」 Fortune 2019年8月5日。 2020年5月13日閲覧
  59. ^ Kröger, Jacob Leon; Lutz, Otto Hans-Martin; Raschke, Philip (2020). 「音声・発話分析のプライバシーへの影響 ― 推論による情報開示」.プライバシーとアイデンティティ管理. より良い生活のためのデータ:AIとプライバシー. IFIP 情報通信技術の進歩. 第576巻. pp.  242– 258. doi : 10.1007/978-3-030-42504-3_16 . ISBN 978-3-030-42503-6. ISSN  1868-4238 .
  60. ^リンゲ、ジェッサ;クロフォード、ケイト(2020年5月15日)「アレクサ、あなたのお母さんについて教えて」秘書の歴史と秘密主義の終焉カタリスト:フェミニズム、理論、テクノサイエンス。6 1):1–22。doi10.1016 / j.dcm.2024.100833
  61. ^ Sindoni, Maria Grazia (2024年12月). 「AI搭載音声アシスタントの女性化:擬人化、擬人化、そして談話イデオロギー」 . Discourse, Context & Media . 62 (100833) 100833. Elsevier. doi : 10.1016/j.dcm.2024.100833 .
  62. ^ 「Alexaを支える技術、Amazon Lexが開発者に公開」 TechCrunch、2017年4月20日。 2017年12月10日閲覧
  63. ^ 「Actions on Google | Google Developers」 。 2017年12月10日閲覧
  64. ^ 「Watson – AIとWatsonがビジネスと世界をどのように変革しているかについてのストーリー」 IBM.com 2017年12月10日閲覧
  65. ^ Memeti, Suejb; Pllana, Sabri (2018年1月). 「PAPA: IBM Watsonコグニティブ・コンピューティング・テクノロジーを搭載した並列プログラミング・アシスタント」. Journal of Computational Science . 26 : 275–284 . doi : 10.1016/j.jocs.2018.01.001 .
  66. ^ 「2017年の5つの消費者トレンド」 TrendWatching、2016年10月31日。 2017年12月10日閲覧
  67. ^ Richter, Felix (2016年8月26日). 「チャート:デジタルアシスタント - いつでもあなたのお役に立ちます」 . Statista . 2017年12月10日閲覧
  68. ^ a b c「バーチャルアシスタント業界統計」 Global Market Insights、2017年1月30日。 2017年12月10日閲覧
  69. ^ a b「2021年までに仮想デジタルアシスタントが世界人口を上回る」ovum.informa.com . 2018年5月11日閲覧
  70. ^ Jones, Nory B.; Graham, C. Matt (2018年2月). 「IoTは中小企業を支援できるか?」科学技術社会誌. 38 ( 1–2 ): 3–12 . doi : 10.1177/0270467620902365 . ISSN 0270-4676 . S2CID 214031256 .  
  71. ^ a b c「AlexaとSiriはこの隠しコマンドを聞き取れますが、あなたには聞こえません」ニューヨーク・タイムズ。2018年5月10日。ISSN 0362-4331 2018年5月11日閲覧 
  72. ^ 「音声アシスタントが主流になる中、研究者は脆弱性について警告」 CNET 2018年5月10日。 2018年5月11日閲覧
  73. ^ Chung, H.; Iorga, M.; Voas, J.; Lee, S. (2017). 「アレクサ、あなたを信頼できますか?」 . Computer . 50 ( 9): 100– 104. doi : 10.1109/MC.2017.3571053 . ISSN 0018-9162 . PMC 5714311. PMID 29213147 .   
  74. ^ 「Baidu、Duerデジタルアシスタント搭載のスマートスピーカー3機種を発表」 VentureBeat 2018年1月8日。
  75. ^ MSV、Janakiram (2015年8月20日). 「Amazon Echoのオープンソース代替品、Mycroftに会おう」 . Forbes . 2016年10月27日閲覧