あいまい一致は、コンピュータ支援翻訳においてレコードリンケージの特殊なケースとして用いられる手法です。テキストのセグメントと過去の翻訳データベースのエントリとの対応関係を見つける際に、100% 完全一致ではない可能性のある一致にも対応します。通常は文レベルのセグメントで動作しますが、一部の翻訳技術では句レベルでの一致も可能です。翻訳者が翻訳メモリ(TM)を使用している場合に使用されます。近似文字列一致を使用します。
背景
翻訳対象テキストに完全一致がTMデータベース内で見つからない場合、完全一致より低い一致を検索するオプションがあります。翻訳者はあいまい一致のしきい値を100%未満のパーセンテージ値に設定し、データベースはそのパーセンテージに対応するメモリ内の一致を返します。あいまい一致の主な機能は、翻訳プロセスを高速化して翻訳者を支援することであり、人間の翻訳者に取って代わることを目的としたものではありません。
歴史
言語、特に英語(ローカリゼーション業界で翻訳対象となる原文の90%を占める[要出典] )の多形性と動的性質のため、翻訳プロセスをより簡単かつ迅速にするための方法が常に模索されています。1980年代後半以降、翻訳者の生産性を向上させ、翻訳プロセス全体を迅速化するために、翻訳メモリツールが開発されてきました。
1990年代には、あいまい一致がTMツールの主要機能として普及し始めました。あいまい一致の「提案」を編集する際に余分な作業が必要になるという問題があったにもかかわらず、あいまい一致は今でもTMの人気のサブセットであり、現在ではほとんどのTMツールに搭載されています。
方法論
TMツールはデータベースを検索し、翻訳対象となる新しい原文内のセグメントと近似的に一致するセグメントを探します。TMは事実上、翻訳者に対して一致するセグメントを「提案」します。翻訳者は、この提案を受け入れるか、翻訳中の新しい原文とより一致するように提案を編集するかを決定します。このように、あいまい一致は翻訳プロセスを迅速化し、生産性の向上につながります。
これは、結果として得られる翻訳の品質に疑問を投げかけます。翻訳者は納期厳守のプレッシャーにさらされているため、適切性や文脈を検証することなく、あいまい一致の提案を受け入れてしまうことがあります。TMデータベースは、様々なテキストを扱う多数の翻訳者からの入力によって構築されるため、この「タペストリー」から抽出された文は、様々なスタイルの寄せ集めとなり、目指すべき一貫性とは正反対のものになってしまう危険性があります。一部の批評家はこれを「センテンスサラダ」と呼んでいます。TMの提案に対する信頼性の問題は、翻訳プロセスの迅速化と翻訳品質のバランスを取ろうとする際に問題となる可能性があります。それでもなお、あいまい一致は翻訳者のツールキットの重要な部分を占めています。
外部リンク
- エッセリンク、B.(2000)ローカリゼーション実践ガイド、ジョン・ベンジャミンズ出版社