
ユーザビリティテストは、ユーザー中心のインタラクションデザインにおいて、ユーザーを対象とする製品評価の手法です。実際のユーザーがシステムをどのように使用しているかを直接的に把握できるため、ユーザビリティの実践において不可欠な要素と言えるでしょう。 [ 1 ]ユーザビリティテストは、製品のデザインの直感性を重視し、事前に製品を経験したことのないユーザーを対象にテストを行います。このようなテストは、最終製品の成功にとって極めて重要です。なぜなら、たとえ完全に機能するアプリケーションであっても、ユーザーに混乱が生じると、長くは続かないからです。[ 2 ]これは、専門家がユーザーを介さずに様々な手法を用いてユーザーインターフェースを評価する ユーザビリティ検査手法とは対照的です。
ユーザビリティテストは、人間が作った製品が意図された目的を達成する能力を測定することに重点を置いています。ユーザビリティテストの恩恵を受ける製品の例としては、食品、消費財、ウェブサイトまたはウェブアプリケーション、コンピュータインターフェース、ドキュメント、デバイスなどが挙げられます。ユーザビリティテストは、特定のオブジェクトまたはオブジェクトセットのユーザビリティ、つまり使いやすさを測定しますが、一般的なヒューマンコンピュータインタラクション研究は、普遍的な原則を定式化しようとします。[ 3 ]
それが何ではないのか
単に物体や文書に関する意見を集めるだけでは、ユーザビリティテストではなく、市場調査や定性調査に該当します。ユーザビリティテストでは通常、制御された条件下で体系的な観察を行い、ユーザーが製品をどの程度快適に使用できるかを判断します。 [ 4 ]しかし、ユーザーの行動だけでなく、動機や認識をより深く理解するために、定性調査とユーザビリティテストの両方が併用されることがよくあります。
ユーザビリティテストでは、ユーザーに下書きを見せて「これ、理解できますか?」と尋ねるのではなく、人々が何かを本来の目的通りに使おうとする様子を観察します。例えば、おもちゃの組み立て説明書をテストする場合、被験者には説明書と部品の入った箱を渡して、実際におもちゃを組み立ててもらうべきです。部品や材料についてコメントするだけでは不十分です。説明書の言い回し、イラストの質、おもちゃのデザインはすべて、組み立てプロセスに影響を与えます。
歴史
ユーザビリティテストはウェブサイトやアプリから始まったわけではありません。1940年代、第二次世界大戦中の飛行機の操縦など、人々が機械をどのように使用していたかを研究する中で初めて登場しました。その後、1980年代にパーソナルコンピュータが普及すると、ヒューマンコンピュータインタラクション(HCI)と呼ばれる新しい分野が生まれ、ユーザビリティテストはテクノロジー設計における標準的な手法として確立されました。
1990年代には、人々がコンピュータを使用する様子を観察し、困難を抱えている領域を特定するための特別なラボが設立され始めました。[ 5 ] 2000年代と2010年代にインターネットとスマートフォンが普及するにつれて、ユーザビリティテストはウェブサイトやアプリにも拡大しました。オンラインで行われるようになり、企業はどこからでも人々を対象にテストを実施できるようになりました。
ユーザビリティテストは、特に急速に変化するテクノロジー環境において、製品設計の標準的な要素となっています。新しいツール、リモートテスト、そしてAIやバーチャルリアリティといった新興技術の登場により、このプロセスはより迅速かつ高度になっています。しかし、その目的は変わりません。それは、テクノロジーを一般の人々にとってより使いやすくすることです。
ユーザビリティラボ
ユーザビリティラボは、フィールドテストやリモートテストとは対照的に、ユーザビリティテストを実施するために特別に設計されたスペースです。リソース、テスト機器、そしてユーザビリティテストの仕様に合わせてフォーマットやアップグレードが可能な専用スペースへのアクセスを通じて、テストに適した環境を提供します。典型的なユーザビリティラボには、机、椅子、コンピューターに加え、テストに特有の追加要素が含まれることがよくあります。[ 6 ]
方法
ユーザビリティテストの設定には、シナリオ、つまり現実的な状況を注意深く作成することが含まれます。シナリオでは、被験者がテスト対象の製品を使用して一連のタスクを実行し、観察者がその様子を観察してメモを取ります(動的検証)。ユーザビリティテストは、研究者がユーザーがタスクを実行しながら製品とどのようにやり取りするかを観察できる構造化されたプロセスに従います。直接的な観察に加えて、研究者はスクリプト化された指示書、紙のプロトタイプ、テスト前後のアンケートなど、いくつかの他のテストツールを使用する場合があります。また、テスト対象の製品に関するフィードバックを収集するために、事前および事後のアンケートも使用されます(静的検証)。[ 7 ]たとえば、電子メールプログラムの添付ファイル機能をテストする場合、シナリオでは、被験者が電子メールの添付ファイルを送信する必要があり、そのタスクを実行するように依頼する状況を記述します。目的は、開発者が問題領域を特定して修正できるように、人々がどのように動作するかを現実的に観察することです。ユーザビリティテスト中にデータを収集するために一般的に使用される手法には、思考発話法、共同発見学習、視線追跡などがあります。[ 8 ]
ゲリラユーザビリティテスト
ゲリラユーザビリティテストは、ホールウェイテストやポップアップリサーチとも呼ばれ、製品やサービスを利用する可能性が最も高い人々が頻繁に訪れる公共スペースで、短い非公式のインタビューを行う、迅速かつ安価なユーザビリティテストの方法です。[ 9 ]
この型破りな手法は、主にデザインプロセスの初期段階で、幅広い一般ユーザー層から直接かつ即時のフィードバックを得るために用いられます。これにより、従来のテストに必要なコストとテスト時間を大幅に削減できます。ゲリラテストは、デザイナーが製品の根本的なユーザビリティ問題を特定し、「例えば、介護施設の入居者、ホームレスの人々、Aレベルの学生など、アプローチが難しい特定のユーザーグループ」をターゲットにするのに役立ちます。[ 9 ]
このタイプのテストは便宜的サンプリングの一例であり、結果に偏りが生じる可能性があります。この方法の限界としては、データが包括的でない、協力的な参加者がいない、より詳細な結果を得るために他のユーザビリティテスト方法と組み合わせる必要がある、などが挙げられます。
リモートユーザビリティテスト
ユーザビリティ評価者、開発者、および見込みユーザーがさまざまな国やタイムゾーンにいる場合、従来のラボでのユーザビリティ評価の実施は、コストとロジスティクスの両方の面で課題が生じます。こうした懸念から、ユーザーと評価者が空間的および時間的に離れた場所で実施するリモート ユーザビリティ評価に関する研究が始まりました。リモート テストは、ユーザーの他のタスクやテクノロジーのコンテキストで評価を実行できるようにし、同期 (モデレート) または非同期 (モデレートなし) のいずれかで行うことができます。前者では、評価者とユーザーがリアルタイムで 1 対 1 のコミュニケーションを行いますが、後者では、評価者とユーザーが別々に作業します。[ 10 ]リモート テストのニーズが高まっているのは、病気や障害にかかりやすい、交通手段が限られているなどの要因により移動が制限されている人々が、重要なサービスや通信にアクセスしやすくすることができるためです。[ 11 ]これら両方のアプローチのニーズに対応するためのツールが数多くあります。
同期型(モデレート型)ユーザビリティテストの方法論には、ビデオ会議やWebExなどのリモートアプリケーション共有ツールの利用が含まれます。WebExは、同期リモートユーザビリティテストを実施するために一般的に使用されている技術です。この形式のリモートテストでは、モデレーターと参加者間のリアルタイムコミュニケーションが可能になり、高齢者や健康、移動、環境条件により外出できない人にとって有益です。従来のユーザビリティテストとは異なり、リモートでは、リストされている合併症を抱える参加者にリーチできます。遠隔医療、オンラインショッピング、リモートバンキングなどのリモートサービスへの依存が高まるにつれて、モデレート型リモートユーザビリティテストは、これらの技術がコスト効率に優れながら、高リスクの人々のニーズを満たすことを保証する上で重要な役割を果たします。[ 11 ]
しかし、同期型リモートテストでは、共同テストプロセスをサポートするのに必要な即時性と「存在感」が欠ける可能性があります。さらに、文化や言語の壁を越えた人間関係のダイナミクスを管理するには、それぞれの文化に配慮したアプローチが必要になる場合があります。その他のデメリットとしては、テスト環境に対するコントロール力の低下や、参加者が母国環境で経験する煩わしさや中断などが挙げられます。[ 12 ]同期型リモートユーザビリティテストを実施するために開発された新しい方法の一つは、仮想世界を利用することです。[ 13 ]
非同期(モデレートなし)手法には、ユーザーのクリックストリームの自動収集、アプリケーション操作中に発生した重大なインシデントのユーザーログ、ユーザーによるインターフェースに関する主観的なフィードバックが含まれます。[ 12 ]ラボ内調査と同様に、非同期リモートユーザビリティテストはタスクベースであり、プラットフォームは自動ログ記録によって研究者がデータを自動的に取得できるようにします。自動ログ記録では、訪問したページ、各ページでの滞在時間、インターフェース操作が収集されます。そのため、多くの大企業にとって、これはウェブサイトやモバイルサイトへの訪問者の訪問意図をより深く理解するのに役立ちます。テストはユーザー自身の環境(ラボではなく)で実施されるため、実際のシナリオテストをよりシミュレートするのに役立ちます。個別のセッションを実施する必要がないため、非同期リモートテストはより多くの参加者を対象とすることができ、従来のLADベースの調査よりも柔軟性と費用対効果に優れています。非同期でのユーザビリティテストの実施も普及しており、テスターは空き時間や自宅で快適にフィードバックを提供できます。[ 14 ]
専門家のレビュー
エキスパートレビューは、ユーザビリティテストの一般的な手法の一つです。その名の通り、この手法では、その分野の経験を持つ専門家(ユーザビリティテストを専門とする企業など)を招き、製品のユーザビリティを評価します。
ヒューリスティック評価またはユーザビリティ監査とは、1人または複数のヒューマンファクター専門家によるインターフェースの評価です。評価者は、1994年にヤコブ・ニールセンによって最初に定義された10のユーザビリティヒューリスティックなどのユーザビリティ原則に基づいて、インターフェースのユーザビリティ、効率性、および有効性を測定します。 [ 15 ]
ユーザー調査や新しいデバイスに応じて進化を続けてきたニールセンのユーザビリティ ヒューリスティックには、次のものが含まれます。
- システムステータスの可視性
- システムと現実世界の一致
- ユーザーコントロールと自由
- 一貫性と基準
- エラー防止
- 思い出すよりも認識する
- 柔軟性と使用効率
- 美しくミニマリストなデザイン
- ユーザーがエラーを認識し、診断し、回復できるように支援する
- ヘルプとドキュメント
自動専門家レビュー
エキスパートレビューと同様に、自動化されたエキスパートレビューは、優れた設計とヒューリスティックに関するルールをプログラムに組み込むことでユーザビリティテストを提供します。自動化されたレビューは、人間によるレビューほど詳細で洞察に富んだレビューを提供できないかもしれませんが、より迅速かつ一貫性を持って完了できます。ユーザビリティテストのために代理ユーザーを作成するというアイデアは、人工知能コミュニティにとって野心的な方向性です。
A/Bテスト
ウェブ開発とマーケティングにおいて、A/B テストまたはスプリット テストはウェブ デザイン (特にユーザー エクスペリエンス デザイン) に対する実験的なアプローチであり、関心のある結果 (バナー広告のクリックスルー率など) を増加または最大化するウェブページの変更を特定することを目的としています。名前が示すように、ユーザーの行動に影響を与える可能性のある 1 つのバリエーションを除いて同一の 2 つのバージョン (A と B) を比較します。バージョン A は現在使用されているバージョンで、バージョン B は何らかの点で変更されている可能性があります。たとえば、e コマース ウェブサイトでは、購入ファネルは通常 A/B テストに適しています。離脱率がわずかに改善されるだけでも、売上が大幅に増加する可能性があるためです。コピー テキスト、レイアウト、画像、色などの要素をテストすることで、大幅な改善を確認できます。
A/Bテストによって改善される典型的な領域には、アルゴリズム、ビジュアル、ワークフロープロセスなどが含まれます。[ 16 ]
多変量テストまたはバケット テストは A/B テストに似ていますが、2 つ以上のバージョンを同時にテストします。
参加者数
1990年代初頭、当時サン・マイクロシステムズの研究者であったヤコブ・ニールセンは、開発プロセスの様々な段階で、通常は5人程度の参加者で構成された小規模なユーザビリティテストを多数実施するという概念を普及させました。彼の主張は、ホームページを見て2、3人が完全に混乱していることが判明した後、さらに多くの人々が同じ欠陥のあるデザインに苦しむのを見ても、得られるものはほとんどないというものです。「手の込んだユーザビリティテストはリソースの無駄です。最良の結果は、5人以下のユーザーを対象に、可能な限り多くの小規模なテストを実施することで得られます。」[ 17 ]
「5人のユーザーで十分」という主張は、後に数学モデル[ 18 ]によって説明され、カバーされていない問題の割合U
ここで、pは被験者1人が特定の問題を特定する確率、nは被験者数(またはテストセッション数)です。このモデルは、実際に存在する問題の数に対する漸近グラフとして現れます(下図参照)。
その後の研究では、ニールセンの主張は経験的証拠[ 19 ]とより高度な数学モデル[ 20 ]の両方を用いて疑問視されてきました。この主張に対する2つの主な反論は次のとおりです。
- ユーザビリティは特定のユーザーセットに関連しているため、このような小さなサンプルサイズでは全人口を代表することは難しいため、このような小さなサンプルのデータは、代表する人口よりもサンプルグループを反映している可能性が高い。
- ユーザビリティの問題は、必ずしも簡単に検出できるわけではありません。解決困難な問題は、プロセス全体を遅らせることがあります。このような状況下では、プロセスの進行はニールセン/ランダウアーの式で予測されるよりもはるかに遅くなります。[ 21 ]
ニールセンは、5人のユーザーによる1回のテストで止めることを推奨していません。彼の主張は、5人のユーザーによるテストを行い、発見された問題を修正した後、修正したサイトを5人の異なるユーザーでテストする方が、10人のユーザーによる1回のユーザビリティテストよりも限られたリソースを有効に活用できるということです。実際には、開発サイクル全体を通して週に1~2回テストが実施され、1ラウンドあたり3~5人の被験者が使用され、結果は24時間以内に設計者に提供されます。したがって、プロジェクト期間中に実際にテストされるユーザーの数は、50人から100人に達することもあります。調査によると、組織が実施するユーザーテストでは、5~10人の参加者を募集することが最も一般的です。[ 22 ]
初期段階では、ユーザーがすぐに問題に遭遇して立ち止まってしまう可能性が最も高いため、通常の知能を持つほぼ誰でも被験者として利用できます。第2段階では、テスターは幅広い能力を持つ被験者を募集します。例えば、ある研究では、経験豊富なユーザーは最初から最後までどのデザインでも問題なく使用できましたが、初心者ユーザーと自認するパワーユーザーはどちらも繰り返し失敗しました。[ 23 ] その後、デザインが安定してきたら、対象集団からユーザーを募集する必要があります。
この手法をプロジェクトの期間中、十分な人数に適用することで、前述の反論は解消されます。サンプルサイズが小さくなくなり、たまにしか使用しないユーザーで発生するユーザビリティの問題も発見されるようになります。この手法の価値は、一度遭遇した特定の設計上の問題はすぐに排除されるため、二度と発生しないという点にあります。一方、成功しているように見える部分は何度もテストされます。確かに、設計上の初期の問題はわずか5人のユーザーによってテストされるかもしれませんが、この手法が適切に適用されれば、最初のテストでうまくいった設計上の部分は、その後50人から100人によってテストされることになります。
参加者サンプリングの限界
小規模サンプルテストの統計的批判
5人の参加者でユーザビリティ問題の85%を特定できるという、広く引用されている主張は、学術的な精査の対象となっています。この主張の根底にある数学モデルは、すべてのユーザーとすべての問題において、問題発見の確率が一定であると仮定しています。研究では、この式は「問題発見における個人差について不当な仮定をしている」ことが示され、このモデルは単純な問題数には当てはまるかもしれませんが、問題の頻度と重大度を考慮した分析では、誤解を招く結果を避けるためにサンプル数を2倍にする必要がある可能性があることが示されました。[ 24 ]
実証研究により、5ユーザーモデルの有効性には大きなばらつきがあることが明らかになっています。ランダム化サンプリング実験では、5ユーザーグループが予測通り平均85%の問題を発見した一方で、その範囲は大きく異なり、5ユーザーグループの中には55%しか発見できなかったグループもあった一方、20ユーザーグループでは95%未満しか発見できなかったグループもありました。[ 25 ]このばらつきは、サンプル数が少ないとユーザビリティの調査結果に大きな不確実性が生じることを示唆しています。
ユーザビリティの問題を検出する確率は一様ではなく、問題の重大性、ユーザ特性、製品の複雑さ、テスト構造によって異なります。[ 26 ]研究によると、ユーザの安全性やタスクの完了に最も深刻な影響を与える可能性のある微妙な問題は検出確率が低く、確実に特定するにはより大きなサンプルサイズが必要になります。[ 27 ]
問題検出率のばらつきを考慮した異質性モデルが提案されており、元のニールセン=ランダウアー式は発見プロセスを過度に単純化していると主張している。これらのモデルは、解決困難な問題が発見プロセス全体を減速させ、結果として元の式が予測するよりも浅い進展をもたらすことを示唆している。
障害のあるユーザーの過少代表
ユーザビリティテストの実践における大きな制約の一つは、障害を持つユーザーが潜在的ユーザーのかなりの割合を占めているにもかかわらず、体系的に過小評価されていることです。世界保健機関(WHO)によると、約13億人(世界人口の16%)が重度の障害を抱えており、人口の高齢化と慢性疾患の増加により、その割合は増加傾向にあります。[ 28 ]平均寿命が70歳を超える国では、人々は平均して生涯の11.5%を障害を抱えて過ごしています。[ 29 ]
障害者は新しい技術から最も恩恵を受ける立場にあるが、協議や開発の初期段階に含まれていないために、これらの開発から取り残されてしまうことが多すぎる。[ 30 ]
研究によると、技術は多様な背景を持つ参加者でテストされることは一般的ではなく、主な障壁としては組織的なプレッシャー、利害関係者の文化、参加者募集の難しさなどがあることがわかりました。[ 31 ]
アクセシビリティガイドラインに準拠するだけではユーザビリティが保証されないため、デザインがアクセス可能かつ使用可能かどうかを判断するには、障害のあるユーザーを対象にテストを行う必要があることが強調されてきました。[ 32 ]業界の専門家は、障害のあるユーザーは障害のないユーザーよりも広範囲の問題を認識しており、すべてのユーザーに影響を与える問題も含まれていると主張しており、障害のないユーザーのみを対象にテストするよりも包括的なテストの方が効率的である可能性を示唆しています。[ 33 ]
デザイン研究における「エクストリームユーザー」という概念は、障害者を含む追加の課題に直面しているユーザーを対象にテストを行うことで、すべてのユーザーのユーザビリティを向上させる洞察が得られるというものです。この現象は、車椅子利用者向けに設計された縁石スロープが、ベビーカー、荷物、または移動に困難を抱える人々にとっても有益であるという観察から、「縁石カット効果」と呼ばれることもあります。[ 34 ]現代のユーザーリサーチの実践の中には、主流ユーザーではなく「エッジユーザー」または「エクストリームユーザー」に焦点を当てているものがあり、デザインがエッジユーザー向けの解決策であれば、すべての顧客にとってシームレスで直感的なものになることがわかります。[ 35 ]
奇妙なサンプリングバイアス
ユーザビリティ研究は、心理学研究で指摘されているような広範なサンプリングの限界、特に西洋、教育水準、工業化、豊かさ、民主主義(WEIRD)社会の参加者への過度の依存という制約を受けています。研究によると、WEIRD集団は世界人口の約12%を占める一方で、公表されている行動科学研究の参加者の96%を占めていることが分かっています。[ 36 ]
このサンプリングバイアスは、ユーザビリティ研究の知見の一般化可能性について疑問を投げかけます。なぜなら、認知プロセスと知覚プロセスは文化によって大きく異なる可能性があることが研究で示されているからです。例えば、視覚知覚に関する研究では、工業化国の人々に確実に影響を与える特定の錯視が、非工業化社会の人々には同様の影響を与えないことが示されています。[ 37 ]
発達心理学研究の体系的なレビューによると、分析された1,582件の記事のうち、中南米、アフリカ、アジア、中東からの参加者を合わせた研究はわずか112件で、米国の参加者のみを対象とした研究は912件でした。[ 38 ]ユーザビリティ研究でも同様のパターンが見られる可能性がありますが、この分野のサンプル人口統計に関する具体的な分析は限られています。
広く認識されているにもかかわらず、サンプリングバイアスが根強く残っているのは、研究者がユーザー集団を代表するのではなく、容易にアクセス可能な参加者を募集する、便宜的サンプリング慣行に起因するとされています。標準的な実験設計では、特定の集団が意図せず除外される可能性もあります。例えば、長時間のテストセッションは神経発達障害のある参加者にとって嫌悪感を抱かせ、自己選択効果によってサンプルの代表性を低下させる可能性があります。
便宜的サンプリングと採用バイアス
便宜的サンプリング(体系的に選抜するのではなく、容易に参加可能な参加者を募集する)は、ユーザビリティテストの実務において広く用いられていますが、大きなバイアスをもたらします。統計的にバランスの取れた選択を行うランダムサンプリングとは異なり、便宜的サンプリングでは、より広範なユーザー母集団を代表しないサンプルが抽出される可能性があります。[ 39 ]
例
例A:医療機器試験(2015年)
2015年版の医療機器のユーザビリティテストでは、ユーザビリティテストを「特定の医療機器が対象ユーザーのニーズや好みを満たすかどうかを判断する手段」であり、「医療機器が危険な使用エラーに対して脆弱かどうかを判断する方法」と定義しています。[ 40 ]
テストプロセスは通常、次のように進行します。
- 計画。ユーザビリティの専門家は、デバイスの設計がユーザーのニーズをどの程度効果的に満たしているかを評価するためのテスト計画を作成します。従来、このようなテストは専用の施設で行われることが多いですが、デバイスや研究の範囲によっては、臨床以外の場所で行われることもあります。
- 参加者の選定:デバイスを使用する個人を反映するよう、代表的なユーザー(医療従事者および患者)を慎重に選定します。アクセシビリティとユーザビリティを評価するために、身体的または認知的制約のある参加者を含めるようサンプルを拡大する場合もあります。
- タスク遂行と観察。被験者は、試験環境、目的、ルールについて説明を受け、機器を用いたタスク遂行前に面接を受ける。「被験者がタスクを遂行している間、試験担当者は…医療機器がタスクをどの程度促進または阻害するかを判断するために、集中的に観察する。」[ 40 ]
- 分析と反復。セッション間の一貫性を評価し、対象ユーザーのニーズに合わない、あるいは安全でない、あるいは非効率的な使用につながる可能性のある潜在的なユーザビリティの問題を明らかにするために、データをレビューします。
このプロセスを通じて、研究者は医療機器と人間の相互作用に関する重要な洞察を得ることができ、設計者は製品のリリース前にユーザビリティの問題を修正できるようになります。
例B:アップルコンピュータ(1982年)
1982年のアップルコンピュータの開発者向けマニュアルでは、ユーザビリティテストについて次のようにアドバイスしている。[ 41 ]
- ターゲットオーディエンスを選びましょう。ヒューマンインターフェースの設計は、まずターゲットオーディエンスを特定することから始めましょう。ビジネスマン向けでしょうか、それとも子供向けでしょうか?
- 対象ユーザーが Apple コンピュータとソフトウェアの主題についてどの程度知っているかを判断します。
- ステップ1と2では、対象ユーザーのニーズに合わせてユーザーインターフェースを設計できます。会計士向けに開発された税務申告ソフトウェアでは、ユーザーはコンピュータに関する知識はゼロでも税法の専門家であると想定されるかもしれません。一方、一般消費者向けに開発されたソフトウェアでは、ユーザーは税金に関する知識はゼロでもAppleコンピュータの基本操作は理解していると想定されるかもしれません。
アップルは開発者に対し、「招集した友人、親戚、新入社員を使ってできるだけ早くテストを始めるべきだ」とアドバイスした。[ 41 ]
私たちのテスト方法は次のとおりです。5~6台のコンピュータシステムを備えた部屋を用意します。5~6人のユーザーからなる2~3グループに、一度にシステムを試用してもらいます(多くの場合、テスト対象がシステムではなくソフトウェアであることをユーザーには知らせません)。部屋にはデザイナーが2人います。デザイナーが2人より少ないと、何が起こっているのかを見逃してしまいます。デザイナーが2人より多いと、ユーザーは常に誰かに監視されているように感じてしまいます。
デザイナーは人々が実際にプログラムを使用する様子を観察する必要がある。なぜなら[ 41 ]
95%のつまずきは、ユーザーのボディランゲージを観察することで発見できます。目を細めたり、肩をすくめたり、首を振ったり、深く心のこもったため息をついたりしていないか、注意深く観察してください。ユーザーは、行き詰まりに陥ると「自分があまり賢くないから」と考え、報告せず、隠そうとします。ユーザーがなぜ混乱したのか、勝手に決めつけてはいけません。ユーザーに尋ねてみてください。ユーザーが迷った時、プログラムが何をしていると考えていたのかを知ると、驚くことがよくあります。
教育
ユーザビリティテストは、様々な分野において学術教育の正式な科目となっています。[ 42 ]ユーザビリティテストは、作文研究やオンラインライティング指導(OWI)において重要です。[ 43 ]研究者のコリン・ビョークは、ユーザビリティテストは「デジタルレトリックの理論と組み合わせなければ、効果的なOWIを開発するには必要だが不十分である」と主張しています。[ 44 ]
調査研究
調査製品には、紙とデジタルの調査、フォーム、調査対象者が単独で、またはデータ収集者と共同で記入・使用できるツールが含まれます。ユーザビリティテストは、Web調査で最も頻繁に行われ、調査の操作、回答の入力、ヘルプ情報の検索など、人々が調査とどのようにやり取りするかに焦点を当てています。ユーザビリティテストは、認知事前テスト(人々が製品をどのように理解するか)、パイロットテスト(調査手順がどのように機能するか)、調査方法論の専門家による専門家レビューなど、従来の調査事前テスト手法を補完するものです。[ 45 ]
翻訳された調査製品では、ユーザビリティテストにより、「文化的適合性」を文と単語レベル、およびデータ入力とナビゲーションの設計で考慮する必要があることが示されています。 [ 46 ]また、翻訳と一般的な機能(タブ、ハイパーリンク、ドロップダウンメニュー、URL)の視覚的なヒントを提示すると、ユーザーエクスペリエンスが向上することが示されています。[ 47 ]
参照
参考文献
- ^ニールセン, J. (1994). ユーザビリティエンジニアリング, Academic Press Inc, p 165
- ^ Mejs, Monika (2019年6月27日). 「ユーザビリティテスト:デザイン検証の鍵」 . Mood Upチーム - ソフトウェアハウス. 2019年9月11日閲覧。
- ^ Frittella, Francesca Maria (2023-01-02).通訳者中心の技術のためのユーザビリティ研究. Language Science Press. ISBN 978-3-96110-403-1。
- ^ Dennis G. Jerz (2000年7月19日). 「ユーザビリティテストとは何か?」 Jerz 's Literacy Weblog . 2016年6月29日閲覧。
- ^ 「ユーザビリティの簡潔な歴史 – MeasuringU」。
- ^ユーザビリティテストの基礎. 2011. doi : 10.1016/c2009-0-20478-8 . ISBN 978-0-12-375092-1。
- ^ Lewis, James R. (2018). 「システムユーザビリティスケール:過去、現在、そして未来」.国際ヒューマンコンピュータインタラクションジャーナル. 34 (7): 577– 590. doi : 10.1080/10447318.2018.1455307 .
- ^アレックス・プール、リンデン・J・ボール (2006). 「HCIとユーザビリティ研究における視線追跡」『ヒューマン・コンピュータ・インタラクション百科事典』pp. 211– 219. doi : 10.4018/978-1-59140-562-7.ch034 . ISBN 978-1-59140-562-7。
- ^ a b「ポップアップリサーチの実施」 GOV.UK. 2025年11月16日閲覧。
- ^ Andreasen, Morten Sieker; Nielsen, Henrik Villemann; Schrøder, Simon Ormholt; Stage, Jan (2007). 「リモートユーザビリティテストに何が起きたのか?」. SIGCHI Conference on Human Factors in Computing Systems の議事録. p. 1405. doi : 10.1145/1240624.1240838 . ISBN 978-1-59593-593-9。
- ^ a b Hill, Jordan R.; Brown, Janetta C.; Campbell, Noll L.; Holden, Richard J. (2021-11-02). 「在宅高齢者のためのユーザビリティ・イン・プレイス:リモート・ユーザビリティ・テスト手法:迅速な文献レビュー」 . JMIR Formative Research . 5 (11) e26181. doi : 10.2196/26181 . PMC 8596282. PMID 34726604 .
- ^ a b Dray, Susan; Siegel, David (2004年3月). 「リモートの可能性?:遠隔地での国際ユーザビリティテスト」. Interactions . 11 (2): 10–17 . doi : 10.1145/971258.971264 .
- ^ Chalil Madathil, Kapil; Greenstein, Joel S. (2011). 「同期リモートユーザビリティテスト」. SIGCHI ヒューマンファクターズ・イン・コンピューティングシステム会議論文集. pp. 2225– 2234. doi : 10.1145/1978942.1979267 . ISBN 978-1-4503-0228-9。
- ^ Nelson, ET; Stavrou, A. (2011). 「Amazon Mechanical Turkを用いたリモート非同期ユーザビリティテストの利点と欠点」.人間工学学会年次大会講演論文集. 55 : 1080–1084 . doi : 10.1177/1071181311551226 .
- ^ 「ヒューリスティック評価」 . ユーザビリティ・ファースト. 2013年4月9日閲覧。
- ^ Quin, Federico; Weyns, Danny; Galster, Matthias; Camila Costa Silva (2023). 「A/Bテスト:体系的な文献レビュー」. arXiv : 2308.04929 [ cs.SE ].
- ^ 「5人のユーザーによるユーザビリティテスト(Jakob NielsenのAlertbox)」 useit.com、2000年3月13日。参考文献:ニールセン、ヤコブ、ランダウアー、トーマス・K. (1993). 「ユーザビリティ問題の発見のための数学モデル」.コンピューティングシステムにおける人間工学に関するSIGCHI会議論文集. pp. 206– 213. doi : 10.1145/169059.169166 . ISBN 978-0-89791-575-5。
- ^ Virzi, RA (1992). 「ユーザビリティ評価におけるテスト段階の改善:被験者は何人いれば十分か?」ヒューマンファクターズ34 ( 4): 457– 468. doi : 10.1177/001872089203400407 .
- ^ Spool, Jared; Schroeder, Will (2001).ウェブサイトのテスト:5人のユーザーでは到底足りない. CHI '01 コンピューティングシステムにおける人間工学に関する拡張概要. p. 285. doi : 10.1145/634067.634236 .
- ^ Caulton, DA (2001). 「ユーザビリティテストにおける均質性仮定の緩和」.行動と情報技術. 20 (1): 1– 7. doi : 10.1080/01449290010020648 .
- ^ Schmettow, Martin (2008年9月1日). 「ユーザビリティ評価プロセスにおける異質性」 .人とコンピュータ XXII 文化、創造性、インタラクション (HCI) . Electronic Workshops in Computing. doi : 10.14236/ewic/HCI2008.9 .
- ^ 「2020年ユーザーテスト業界レポートの結果」 www.userfountain.com 2020年6月4日閲覧。
- ^ブルース・トグナッツィーニ「ウィンドウの最大化」
- ^コックトン、ギルバート、ウールリッチ、アラン (2001). 「検査方法の理解:ヒューリスティック評価の評価から学ぶこと」 . 『人とコンピュータ XV 国境なきインタラクション』 . ロンドン: シュプリンガー・ロンドン. pp. 171– 191. doi : 10.1007/978-1-4471-0353-0_11 . ISBN 978-1-85233-515-1. 2026年1月10日閲覧。
- ^ Faulkner, Laura (2003年8月). 「5ユーザー仮定を超えて:ユーザビリティテストにおけるサンプル数増加のメリット」 . Behavior Research Methods, Instruments, & Computers . 35 (3): 379– 383. Bibcode : 2003BRMIC..35..379F . doi : 10.3758/BF0 3195514. ISSN 0743-3808 . PMID 14587545 .
- ^ Virzi, Robert A. (1992年8月). 「ユーザビリティ評価におけるテスト段階の改善:被験者は何人いれば十分か?」 .ヒューマンファクターズ:ヒューマンファクターズ・エルゴノミクス学会誌. 34 (4): 457– 468. doi : 10.1177/001872089203400407 . ISSN 0018-7208 .
- ^ Casanave, Christine Pearson (2024年10月21日). 「専門知識の一形態としての博士論文執筆、メンタリング、アドバイジングに関する考察」 .第二言語ライティング指導における専門知識. ニューヨーク: Routledge. pp. 135– 150. doi : 10.4324/9781032626864-8 . ISBN 978-1-032-62686-4. 2026年1月10日閲覧。
- ^ 「障害」 . www.who.int . 2026年1月10日閲覧。
- ^ 「障害者に関するファクトシート」www.un.org . 2026年1月10日閲覧。
- ^ 「ワンストップアクセシビリティテスト」 InnovationAUS 、 2025年11月21日。
- ^ Rutter, Sophie; Zamani, Efpraxia; McKenna-Aspell, Jo; Wang, Yuhua (2024年8月). 「ユーザビリティテストにおける平等性、多様性、インクルージョンの組み込み:推奨事項と研究課題」 . International Journal of Human-Computer Studies . 188 103278. doi : 10.1016/j.ijhcs.2024.103278 . ISSN 1071-5819 .
- ^ 「アクセシビリティとインクルーシビティ:学習ガイド」ニールセン・ノーマン・グループ。 2026年1月10日閲覧。
- ^ 「インクルーシブ・ユーザビリティ・テスト:インクルーシブ・デザインのメリット|Vision Australia. 視覚障碍者および低視力者向けサービス」 www.visionaustralia.org 2026年1月10日閲覧。
- ^ 「暴力を抑制するために」。社会サービスレビュー。33 ( 1): 71。1959年3月。doi : 10.1086 / 640623。ISSN 0037-7961。
- ^ Please, See Me. 「アクセシビリティテストとリサーチ – See Me Please」seemeplease.com . 2026年1月10日閲覧。
- ^ヘンリッチ, ジョセフ; ハイネ, スティーブン J.; ノレンザヤン, アラ (2010年6月). 「世界で最も奇妙な人々?」 .行動と脳科学. 33 ( 2–3 ): 61–83 . doi : 10.1017/S0140525X0999152X . ISSN 0140-525X . PMID 20550733 .
- ^フィッシャー、GH(1967年5月)。「MHセガル、DTキャンベル、MHハースキヴィッツ共著『文化の視覚知覚への影響』のレビュー。(ボブス・メリル、1996年)[p. ix +268]。2.95ドル。」エルゴノミクス。10(3 ):361-363。doi :10.1080 / 00140136708930878。ISSN 0014-0139。
- ^ニールセン, マーク; ハウン, ダニエル; ケルトナー, ヨシュカ; レガレ, クリスティン H. (2017年10月). 「発達心理学における持続的なサンプリングバイアス:行動への呼びかけ」 .実験児童心理学ジャーナル. 162 : 31–38 . doi : 10.1016/j.jecp.2017.04.017 . PMC 10675994. PMID 28575664 .
- ^ Etikan, Ilker (2016). 「便宜的サンプリングと目的的サンプリングの比較」 . American Journal of Theoretical and Applied Statistics . 5 (1): 1. doi : 10.11648/j.ajtas.20160501.11 . ISSN 2326-8999 .
- ^ a b P.E, Michael E. Wiklund; Kendler, Jonathan; Strochlic, Allison Y. (2015-12-23).医療機器のユーザビリティテスト. CRC Press. ISBN 978-1-4665-9589-7。
- ^ a b cマイヤーズ, ジョー; トグナッツィーニ, ブルース (1982). Apple IIe 設計ガイドライン(PDF) . アップルコンピュータ. pp. 11– 13, 15.
- ^ Breuch, Lee-Ann M. Kastman; Zachry, Mark; Spinuzzi, Clay (2001年4月). 「テクニカルコミュニケーションプログラムにおけるユーザビリティ指導:カリキュラム開発の新たな方向性」. Journal of Business and Technical Communication . 15 (2): 223– 240. doi : 10.1177/105065190101500204 .
- ^ミラー・コクラン、スーザン・K.、ロドリゴ、ロシェル・L.(2006年1月)「ユーザビリティテストによる効果的な遠隔学習デザインの決定」『コンピュータと作文』23 (1): 91–107 . doi : 10.1016/j.compcom.2005.12.002 .
- ^ Bjork, Collin (2018年9月). 「OWIにおけるユーザビリティテストとデジタルレトリックの統合」. Computers and Composition . 49 : 4–13 . doi : 10.1016/j.compcom.2018.05.009 .
- ^ガイゼン、エミリー、バーグストロム、ジェニファー・ロマーノ (2017).調査研究のためのユーザビリティテスト. ケンブリッジ: エルゼビア MK モーガン・カウフマン・パブリッシャーズ. ISBN 978-0-12-803656-3。
- ^王林、沙マンディ、袁ミシェル (2017). 「米国国勢調査インターネット調査における中国語版のユーザビリティにおける文化的適合性」 .調査実践. 10 (3): 1– 8. doi : 10.29115/SP-2017-0018 .
- ^ Sha, Mandy; Hsieh, Patrick; Goerman, Patricia (2018). 「翻訳と視覚的な手がかり:米国における英語が限られた人々が翻訳されたインターネット調査にアクセスするためのロードマップの作成に向けて」国際翻訳通訳研究ジャーナル10 ( 2): 142– 158. doi : 10.12807/ti.110202.2018.a10 .