英語はコンピューター科学の共通語と呼ばれることがあります。ラテン語やギリシャ語が主流である他の科学分野と比較すると、コンピューター科学では英語が主要な言語として利用されています。
コンピューター分野における英語の普及は、歴史的要因と技術的要因の両方によるものです。米国と英国はどちらも英語を母語とする国民が多数を占めており、コンピュータシステム、コンピュータネットワーク、ソフトウェア、そして情報技術の開発と普及において重要な役割を果たしてきました。
さらに、初期のコンピュータの技術的限界とインターネットにおける国際標準化の欠如が相まって、インターネットインフラの革新とコンピュータ速度の向上によって状況が変化するまで、英語がコンピューティングを支配し続けました。しかし、英語の優位性が、他の言語を活用した技術革新やコンピュータサイエンスへの貢献を覆い隠すべきではありません。また、広く使用されている英語ベースの技術の多くは、米国や英国で開発されたものではありません。例えば、Rubyは日本製です。
英語はコンピューターやコンピューティング技術に関して依然としてさまざまな言語に影響を与えていますが、現在ではほとんどのソフトウェア製品が多数の言語にローカライズされており、 Unicode文字エンコーディングの発明により、ラテン文字以外のアルファベットの問題は解決されています。
コンピュータサイエンスは、究極的には英語圏以外の文化によって築かれた数学的な基盤を持っています。古代近東で最初に数学的な知識を持った社会では、数学の問題を段階的に解く方法が記録されていました。[ 1 ] 「アルゴリズム」という言葉は、ヒンドゥー・アラビア数字の普及に貢献した中世アラビアの有名な数学者、アル・フワーリズミーの名前に由来しています。[ 2 ] 2進数を初めて体系的に扱ったのはドイツの数学者ライプニッツです。 [ 3 ]ライプニッツは、当時の科学の共通語であったフランス語でこのテーマに関する論文を執筆しました。[ 4 ]そして、現在コンピュータハードウェアと呼ばれているものの革新は、英語の伝統の外で起こり、パスカルが最初の機械式計算機を発明し、ライプニッツがそれを改良しました。[ 5 ]
計算機の構築への関心は、第二次産業革命の到来とともに、19世紀に初めて現れました。イギリスの伝統における計算機の起源は、この時代にチャールズ・バベッジによる差分解析機関の概念化、ジョージ・ブールの論理学に関する研究、そしてハーマン・ホレリスによる1890年の米国国勢調査専用の集計機の発明に始まりました。[ 6 ]当時、イギリスはパックス・ブリタニカの絶頂期に西洋でほぼ完全な覇権を握り、アメリカは経済的および人口学的好況を経験していました。20世紀初頭の戦間期までには、計算機の発展に関連する最も重要な数学は英語で行われ、英語は科学の新しい共通語になり始めていました。[ 7 ]
近年、一部の学者はコンピューター分野における英語の優位性について、より批判的に研究し始めている。例えば、歴史家のトーマス・マラニーは、QWERTYキーボードの問題に中国のコンピューター業界がどのように対応したかを研究している。QWERTYキーボードはキーの選択肢が限られていたため、英語と中国語の言語の違いから、当初は中国のコンピューターユーザーにとってあまり使いやすかった。[ 8 ]マラニーは著書『中国のコンピューター:情報化時代の世界史』の中で、中国のコンピューターユーザーがこの課題を克服するために用いた革新的な戦略などを検証している。[ 9 ]一方、学者のマーク・ワーシャウアーは、さまざまな世界的文脈におけるインターネットの利用状況を研究し、英語ではデジタル情報が過剰に利用できる一方で、他の言語では利用できる情報が大幅に少なく、これが社会的包摂にとって問題となっていると記している。[ 10 ]
英語がプログラミング言語の標準であったにもかかわらず、非西洋諸国では広く普及したプログラミング言語が数多く開発されました。最も人気のあるプログラミング言語の一つであるPythonは、1991年にオランダでGuido van Rossumによって開発されました。[ 11 ] また、日本では、主にWeb開発に用いられるプログラミング言語であるRubyが、1990年代半ばにまつもとゆきひろ氏(Matz)によって開発されました。[ 12 ]国際的な開発コミュニティでは、英語の方がより適切であると考えられていました。フランス語のキーワードに基づいて、初心者向けプログラミング言語としてフランスで誕生したLangage Symbolique d'Enseignement – Symbolic Language for Teaching (LSE)は、世界的なフランス語の知識不足が原因で失敗しました。結果として、PASCALはスイスで誕生しながらも英語で開発されました。[ 13 ]
多くの言語のコンピュータ用語は英語から借用されています。一部の言語コミュニティはこの傾向に積極的に抵抗していますが、他のコミュニティでは英語が広範かつより直接的に使用されています。このセクションでは、他の言語における英語の借用語の使用例をいくつか示し、注目すべき違いについて言及します。
英語とロシア語の両方がブルガリアのコンピューター用語に影響を与えてきました。しかし、多くの場合、借用語は英語から音声的に転写されるのではなく、ブルガリア語に翻訳されています。キリル文字の使用と相まって、借用語の認識が困難になることがあります。例えば、ブルガリア語で「マザーボード」はдънна платка(IPA: [ˈdɤnna ˈplatka] )で、文字通り「底板」を意味します。
フェロー語には、言語自体に基づいた科学用語がほとんどありません。フェロー語の科学用語の多くは、特に北欧や英語の同義語から借用または改変されたものです。語彙は常に進化しており、新しい単語はしばしば消滅し、生き残って広く使われるようになるのはごくわずかです。成功した単語の例としては、「telda」(コンピューター)、「kurla」(アットマーク)、「ambætari」(サーバー)などが挙げられます。[ 14 ]
フランス語には、一般的に受け入れられている英語からの借用語がいくつかありますが、それらを避ける明確な努力も行われています。フランスでは、アカデミー・フランセーズが言語の標準化を担っており、しばしば新しい技術用語を生み出しています。それらのいくつかは実際に受け入れられていますが、多くの場合、英語からの借用語が依然として主流です。ケベック州では、ケベック州フランス語事務所(Office québécois de la langue française)が同様の役割を担っています。
ドイツ語では、英語の単語もよく使われます。
日本語では外来語にカタカナが用いられており、その多様な語は現在も使われています。英語のコンピューター用語は、現代の日本語の語彙に依然として多く残っています。
日本語のローマ字入力に適したキーボードレイアウトを 利用すると、ユーザーはラテン文字を入力して、ひらがな、カタカナ、漢字を含む日本語を表示できます。
通常、コンピュータのキーボードで日本語を入力する場合、テキストはローマ字表記で入力されますが、ヘボン式、訓令式、または日本式ローマ字表記のいずれかを選択できます。一般的な日本語ワードプロセッサでは、これら3つすべてに対応しています。長母音は、かな表記に従って入力されます。例えば、長母音の「o」は、サーカムフレックスまたはマクロン(ôまたはō )付きの「 o」ではなく、 「 ou 」と入力されます。文字が入力されると、指定に応じて自動的にひらがなまたはカタカナに変換されます。そして、これらのかな句は、必要に応じて漢字に変換されます。[ 16 ]
アイスランド語には独自の科学用語の語彙があります。英語からの借用語も存在し、主に日常会話で使われています。一方、アイスランド語の単語は英語よりも長かったり、あまり普及していなかったりする場合があります。
イタリア語では、コンピューティングに関連するほとんどの単語は英語のまま残されており、イタリア語固有の単語はほとんど使用されていません。これらのイタリア語固有の単語は通常、そのような製品の初期のバージョンを説明するために使用されます (たとえば、イタリア語でcomputerはよく使われる単語であり、calcolatore はパンチカード コンピューターに対してほぼ独占的に使用されます)。または、比喩が簡単に翻訳できない場合は完全に避けられることもあります (例: mouse 。finestra がwindow を翻訳するために使用されるのと は対照的です)。
すべてのスカンジナビア言語では、コンピューティングに関して英語の単語を使用するのが一般的です。
名詞:メール(電子メールを指す)、ソフトウェア、ブログ(「ブログ」から)、スパム
動詞:ブート、スパム、ブログ
英語由来の ポーランド語の用語:
ラテンアメリカのソフトウェア産業とインターネットに対する英語の影響は、カスティーリャ語の語彙から大きく影響を受けています。
スペイン語のコンピューター用語の多くは、英語と共通の語源を持っています。これらの場合、どちらの用語も理解できますが、正式な用法としてはスペイン語が好まれます。
初期のコンピュータソフトウェアとハードウェアは、ラテンアルファベット以外の文字セットをほとんどサポートしていませんでした。そのため、他の文字体系に基づく言語を表現することは困難、あるいは不可能でした。 1960年代に開発されたASCII文字エンコーディングは、通常、7ビット形式で128種類の文字しかサポートしていませんでした。追加のソフトウェアを使用することで、キリル文字に基づく言語など、一部の言語をサポートすることが可能になりました。しかし、中国語や日本語のような複雑な文字体系や表意文字の言語では、8ビット文字エンコーディングの256文字制限よりも多くの文字数が必要になります。旧ソ連で製造された一部のコンピュータは、キリル文字をネイティブでサポートしていました。
UnicodeとウェブにおけるUTF-8の普及により、これらの歴史的な制限のほとんどは解消されました。ASCIIはコマンドインタープリタ、プログラミング言語、テキストベースの通信プロトコルの事実上の標準であり続けていますが、徐々に衰退しつつあります。
ほとんどのプログラミング言語の構文は英語のキーワードを使用しているため、それらを使用するにはある程度の英語の知識が必要であると言えるでしょう。いくつかの研究では、英語を母国語としないプログラマーは、英語がプログラミング能力の最大の障害であると自覚していることが示されています。[ 18 ]しかし、すべてのプログラミング言語は形式言語のクラスに属していることを認識することが重要です。形式言語は、英語を含むあらゆる自然言語とは大きく異なります。
英語以外のプログラミング言語の例:
多くのアプリケーションプロトコルは、下位層プロトコルで一般的に使用されるバイナリ値ではなく、リクエストとパラメータにテキスト文字列を使用します。リクエスト文字列は一般的に英語の単語に基づいていますが、場合によっては英語表現の短縮形や頭字語が使用されるため、英語力に関わらず、プロトコルに精通していない人にとってはやや難解に感じられることがあります。しかし、単語のような文字列の使用は、当業者(および十分な英語の知識を持つ人)が、通常はサービスの問題を見つける目的で、キーボードからプロトコルを手動で実行できるようにする便利な記憶術です。
例:
応答コード、つまりリクエストの受信者から返される文字列は、通常、数値であることは注目に値する。例えば、HTTP(および他のプロトコルから借用された文字列)では、
これは、レスポンスコードも明確な情報を伝える必要がある一方で、リクエスト側が後続のアクションを変化させるために様々なニュアンスを持つ可能性があるためです。このような「サブコード」をすべてアルファベットで伝えるのは扱いにくく、擬似英語の単語を使用する利点が損なわれます。レスポンスは通常ソフトウェアによって生成されるため、ニーモニックである必要はありません。数値コードも、人間が手入力でプロトコルをテストするよりも、ソフトウェアで処理する方が分析と分類が容易です。
多くのパーソナルコンピュータにはBIOSまたはUEFIファームウェア チップが搭載されており、起動時および構成画面に英語のテキストが表示されます。
キーボード ショートカットは通常、検索の場合はCTRL+Fのように英語のキーワードで定義されます。
英語はワールドワイドウェブ上で最も多く使われている言語であり、インターネットユーザーの25%以上が英語を使用しています。[ 19 ]
ウェブユーザーの割合は、通常、ウェブにアクセスするユーザーの母国語のみの比較に焦点を当てています。同様に重要なのは、第二言語および外国語を使用するユーザーを考慮することです。つまり、ユーザーの母国語は、必ずしもウェブ利用時に日常的に使用する言語を反映するものではありません。
英語圏のユーザーはウェブ利用者の過半数を占めており、常に全体の約3分の1(約10億人)を占めているとされています。これは、英語圏の国々の相対的な豊かさとインターネット普及率の高さを反映しています。この優位性は、主に中国人ユーザーの急増によって失われつつある可能性があります。[ 20 ]
その他の比較的裕福な国の母語話者数は概ね安定しているようで、最も多いのはドイツ語と日本語で、それぞれ全体の 5% ~ 10% を占めています。
英語のウェブコンテンツの量として広く引用されている数字の一つは80%です。 [ 21 ]他の情報源では5~15ポイント低い数字を示していますが、それでも50%を大きく上回っています。[ 22 ] [ 23 ] [ 24 ]これらの割合については、注目すべき事実が2つあります。
英語のウェブ コンテンツは、英語を母国語とするユーザーの数より 2 倍も多くなります。
英語は既に圧倒的なリードを誇っており、他の分野でも共通語として利用が増えていることを考えると、英語を母国語とするインターネット利用者が減少しても、英語のウェブコンテンツは引き続き優位に立つ可能性があります。これは典型的な正のフィードバックループです。つまり、新しいインターネット利用者は英語を学び、オンラインで活用することが有益だと感じ、その結果、英語の威信が高まり、その後の新規利用者も英語を学ばざるを得なくなるのです。
ウェブコンテンツにおいて英語が主流となった要因としては、他にもいくつか(一部はメディアの登場以前から存在していた)ある。この点で最も注目すべきは、研究者や専門家が最大限の露出を確保するために英語で出版する傾向である。例えば、医学書誌情報の最大のデータベースによると、過去40年間、英語は最も多く使用されている言語であり、そのシェアは同時期に継続的に増加している。[ 25 ]
英語圏以外の人々が英語で定期的に出版しているという事実は、英語の優位性をさらに強固なものにしています。英語には豊富な技術用語があり(これは主に、ネイティブスピーカーと非ネイティブスピーカーの両方が技術的なアイデアを伝える際に英語を使用しているためです)、多くのITおよび技術専門家は出身国に関わらず英語を使用しています(例えば、 Linus Torvaldsはフィンランド出身で母国語がスウェーデン語であるにもかかわらず、コードには英語でコメントしています)。