インターネットトラフィックとは、インターネット全体、またはインターネットを構成するネットワークの特定のネットワークリンクにおけるデータの流れを指します。一般的なトラフィックの測定単位は、総量(バイト単位)、または一定時間あたりのバイト単位の伝送速度です。
インターネットのトポロジは階層的ではないため、インターネット全体のトラフィックを単一の測定点から測定することはできません。トラフィック量は、Tier 1ネットワークプロバイダーのピアリングポイントから取得できます。ただし、これらのデータには、単一のサービスプロバイダーのネットワーク内に留まるトラフィックと、プライベートピアリングポイントを通過するトラフィックは含まれません。
2022年12月現在、モバイルインターネットトラフィックのほぼ半分(48%)はインドと中国で発生しており、北米とヨーロッパでは約4分の1を占めています。[ 1 ]ただし、モバイルトラフィックは依然としてインターネットトラフィック全体の少数派です。
ファイル共有はインターネットトラフィックの一部を占めています。[ 2 ]ファイル共有の主流技術はBitTorrentプロトコルです。これは、リソースディレクトリを提供するインデックスサイトを介したピアツーピア(P2P)システムです。Sandvine Researchの2013年の調査によると、BitTorrentのインターネットトラフィック全体におけるシェアは、2008年の31%から20%減少し、7.4%となりました。[ 3 ]
2023年現在、インターネットトラフィック全体の約65%は動画サイトからのものであり、[ 4 ] 2016年の51%から増加している。[ 5 ]

インターネットトラフィック管理(アプリケーショントラフィック管理とも呼ばれる)。インターネットは、トラフィック管理のために形式的に中央集権化された設備を採用していません。その先駆的なネットワーク、特にARPANETは、主要なトラフィック交換センター間のトラフィックを伝送する初期のバックボーンインフラストラクチャを確立しました。その結果、インターネットサービスプロバイダー(ISP)の階層化されたシステムが形成され、 Tier 1ネットワークは、決済不要のピアリングと下位のISPへのトラフィックルーティングを通じてトラフィック交換を提供しました。世界規模のネットワークの急速な成長により、インターネットのあらゆるピアリングレベルで相互接続がますます増加し、リンク障害、ボトルネック、その他の輻輳を様々なレベルで緩和できる堅牢なシステムが開発されました。
経済的トラフィック管理(ETM)とは、ピアツーピアのファイル共有やデジタル世界全般におけるコンテンツの配信における貢献に応える実践として、シーディングの機会を指摘するために時々使用される用語です。 [ 6 ]
ハンガリーでは、データ通信量1ギガバイトあたり150フォリント(0.62米ドル、0.47ユーロ)のインターネット利用税が導入される予定で、インターネット通信量を削減するとともに、企業が法人税を相殺して新たな課税を行えるようにすることが目的となっている。[ 7 ] ハンガリーでは2013年に11億5000万ギガバイトのデータ通信量を達成し、さらにモバイル機器によって1800万ギガバイトが蓄積された。コンサルティング会社eNetによると、この新たな税制により、1750億フォリントの追加収入が見込まれていた。[ 7 ]
ヤフーニュースによると、ミハイ・ヴァルガ経済大臣は「消費者が電話回線からインターネットへと移行していることを反映した税金であり、公平だ」とし、「データ転送1ギガバイトにつき150フォリントの課税は、EUで最も負債の多い国の一つであるドイツの2015年度予算の穴埋めに必要だった」と述べ、この措置を擁護した。[ 8 ]
この新しいインターネット税の計画は、国の経済発展に不利に働き、情報へのアクセスを制限し、表現の自由を妨げると主張する人もいる。[ 9 ]約3万6000人が、この税案に抗議するため経済省の外で開催されるFacebook上のイベントに参加登録した。[ 8 ]
1998年、米国はインターネット税自由法(ITFA)を制定し、電子メール、インターネットアクセス、ビット税、帯域幅税など、インターネットの使用とオンライン活動への直接税の課税を防止した。 [ 10 ] [ 11 ]当初、この法律はそのような税金を10年間一時停止し、その後複数回延長され、2016年に恒久化された。 ITFAの目標は、インターネットの採用と使用を妨げる可能性のある反復的で差別的な税金を禁止することにより、消費者を保護し、インターネットトラフィックの成長を支援することであった。その結果、ITFAはデジタル経済を促進し、消費者の利益を守る上で重要な役割を果たしてきた。 ピュー研究所によると、2024年の時点で、約93%のアメリカ人がインターネットを利用しており、YouTubeやFacebookなどのプラットフォームが非常に人気がある。[ 12 ] [ 13 ] [ 14 ]さらに、2021年までに米国の世帯の90%が高速インターネットサービスに加入しました。[ 15 ] [ 16 ] ITFAは直接的なインターネット税に対する保護を提供しますが、インターネットの規制とガバナンスに関する継続的な議論は、米国のインターネットトラフィックと使用の状況を形成し続けています。
トラフィック分類とは、トラフィック内の特徴を受動的に観察し、特定の分類目標に沿ってトラフィックを分類する方法を指します。大まかな分類目標のみを持つものもあります。例えば、バルク転送、ピアツーピアファイル共有、トランザクション指向などです。一方、よりきめ細かな分類目標、例えばトラフィックに含まれるアプリケーションの正確な数を設定するものもあります。トラフィックの特徴には、ポート番号、アプリケーションペイロード、時間、パケットサイズ、トラフィックの特性などがあります。インターネットトラフィックを割り当てる方法は多岐にわたり、例えばポート(コンピュータネットワーク)番号、ペイロード、ヒューリスティック、統計的機械学習など、トラフィックの正確な割り当て方法も含まれます。
正確なネットワークトラフィック分類は、セキュリティ監視からアカウンティング、そしてサービス品質からオペレータへの長期プロビジョニングのための有用な予測提供まで、インターネットにおける様々な活動の基本です。しかしながら、ネットワークに関する利用可能な知識の不足により、分類スキームを正確に運用することは非常に複雑です。例えば、パケットヘッダー関連の情報は、正確な方法論を実現するには常に不十分です。
ネットワークトラフィックを分類するための教師あり機械学習に関する研究[ 17 ]。データはフローの内容に基づいて複数のカテゴリのいずれかに手動で分類される。データセット(手動で割り当てた)カテゴリと分類されたフローの説明(フローの長さ、ポート番号、連続するフロー間の時間など)の組み合わせを使用して、分類器をトレーニングする。この手法自体をより深く理解するために、初期の仮定を立て、さらに他の2つの手法を実際に適用する。1つは、情報の入力品質と分離を改善することで、ナイーブベイズ分類器の精度を向上させることである。
分類作業の基本は、インターネットトラフィックの種類を分類することです。これは、一般的なアプリケーショングループを「正常」と「悪意のある」などの異なるカテゴリに分類したり、より複雑な定義(特定のアプリケーションや特定の伝送制御プロトコル(TCP)実装の識別など)を適用したりすることで行われます。[ 18 ] Logg et al. [ 19 ]より引用
トラフィック分類は、自動侵入検知システムの主要構成要素です。[ 20 ] [ 21 ]これらは、優先顧客のネットワークリソースのパターンや兆候を特定したり、事業者の利用規約に違反するネットワークリソースの顧客使用を特定したりするために使用されます。一般的に導入されているインターネットプロトコル(IP)トラフィック分類技術は、ネットワーク上の特定の時点で各パケットの内容を直接検査することにほぼ基づいています。送信元アドレス、ポート、宛先アドレスは、同じではないにしても類似の5つのプロトコルタイプを持つ連続するIPパケットに含まれています。これらのパケットは、制御アプリケーションを特定したいフローに属していると見なされます。単純な分類では、ほとんどのアプリケーションが常に既知のTCPまたはUDPポート番号を使用していると仮定して、制御アプリケーションのIDを推測します。しかし、多くの候補アプリケーションは予測不可能なポート番号を使用することが増えています。その結果、より高度な分類技術では、TCPまたはユーザーデータグラムプロトコル(UDP)ペイロード内のアプリケーション固有のデータを探すことで、アプリケーションの種類を推測します。[ 22 ]
大手ネットワークシステム企業であるシスコは、複数の情報源からデータを集約し、使用状況とビットレートの想定を適用して、次のようなインターネットプロトコル(IP)とインターネットトラフィックの過去の数値を公開している。[ 23 ]
| 年 | IPトラフィック(PB /月) | 固定インターネットトラフィック(PB /月) | モバイルインターネットトラフィック(PB /月) |
|---|---|---|---|
| 1990 | 0.001 | 0.001 | 該当なし |
| 1991 | 0.002 | 0.002 | 該当なし |
| 1992 | 0.005 | 0.004 | 該当なし |
| 1993 | 0.01 | 0.01 | 該当なし |
| 1994 | 0.02 | 0.02 | 該当なし |
| 1995 | 0.18 | 0.17 | 該当なし |
| 1996 | 1.9 | 1.8 | 該当なし |
| 1997 | 5.4 | 5.0 | 該当なし |
| 1998 | 12 | 11 | 該当なし |
| 1999 | 28 | 26 | 該当なし |
| 2000 | 84 | 75 | 該当なし |
| 2001 | 197 | 175 | 該当なし |
| 2002 | 405 | 356 | 該当なし |
| 2003 | 784 | 681 | 該当なし |
| 2004 | 1,477 | 1,267 | 該当なし |
| 2005 | 2,426 | 2,055 | 0.9 |
| 2006 | 3,992 | 3,339 | 4 |
| 2007 | 6,430 | 5,219 | 15 |
| 2008年[ 24 ] | 10,174 | 8,140 | 33 |
| 2009年[ 25 ] | 14,686 | 10,942 | 91 |
| 2010年[ 26 ] | 20,151 | 14,955 | 237 |
| 2011年[ 27 ] | 30,734 | 23,288 | 597 |
| 2012年[ 28 ] [ 29 ] | 43,570 | 31,339 | 885 |
| 2013年[ 30 ] | 51,168 | 34,952 | 1,480 |
| 2014年[ 31 ] | 59,848 | 39,909 | 2,514 |
| 2015年[ 32 ] | 72,521 | 49,494 | 3,685 |
| 2016年[ 33 ] | 96,054 | 65,942 | 7,201 |
| 2017年[ 34 ] | 12万2000 | 85,000 | 1万2000 |
「固定インターネットトラフィック」とは、おそらく家庭や企業の加入者からISP、ケーブル会社、その他のサービスプロバイダへのトラフィックを指していると考えられます。「モバイルインターネットトラフィック」とは、携帯電話の基地局やプロバイダからのバックホールトラフィックを指していると考えられます。「インターネットトラフィック」の全体値は、他の2つの合計値よりも30%高くなる場合があり、これはおそらく国内バックボーンの中核部分のトラフィックを考慮していると考えられます。一方、その他の数値は主にネットワーク周辺部から算出されているようです。
Cisco は 5 年間の予測も公開しています。
| 年 | 固定インターネットトラフィック(EB /月) | モバイルインターネットトラフィック(EB /月) |
|---|---|---|
| 2018 | 107 | 19 |
| 2019 | 137 | 29 |
| 2020 | 174 | 41 |
| 2021 | 219 | 57 |
| 2022 | 273 | 77 |
米国のインターネットバックボーンに関する以下のデータは、ミネソタインターネットトラフィック研究(MINTS)から得たものである。[ 35 ]
| 年 | データ(TB /月) |
|---|---|
| 1990 | 1 |
| 1991 | 2 |
| 1992 | 4 |
| 1993 | 8 |
| 1994 | 16 |
| 1995 | 該当なし |
| 1996 | 1,500 |
| 1997 | 2,500~4,000 |
| 1998 | 5,000~8,000 |
| 1999 | 10,000~16,000 |
| 2000 | 2万~3万5千 |
| 2001 | 4万~7万 |
| 2002 | 8万~14万 |
| 2003 | 該当なし |
| 2004 | 該当なし |
| 2005 | 該当なし |
| 2006 | 45万~80万 |
| 2007 | 75万~125万 |
| 2008 | 1,200,000~1,800,000 |
| 2009 | 1,900,000~2,400,000 |
| 2010 | 260万~310万 |
| 2011 | 3,400,000~4,100,000 |
シスコのデータはミネソタ・インターネット・トラフィック・スタディーズ(MINTS)のデータの7倍にもなる可能性がある。これは、シスコの数字が米国国内だけでなく世界全体のインターネットの推定値であるだけでなく、シスコが「一般的なIPトラフィック(したがって、インターネットの一部ではないが、IP(インターネットプロトコル)を使用する、様々な通信会社のIPTVサービスなど、IPを使用するクローズドネットワークを含む)」をカウントしているためである。[ 36 ] MINTSによる2004年の米国国内バックボーントラフィックの推定値は200ペタバイト/月と推定されるが、これは米国最大のバックボーンキャリアであるレベルスリー社のトラフィック量の3倍に相当する。レベルスリー社は平均トラフィック量を60ペタバイト/月としている。[ 37 ]
過去、通信ネットワークにおけるインターネット帯域幅は18ヶ月ごとに倍増しており、これはエドホルムの法則として表現されています。[ 38 ]これは、金属酸化物シリコン(MOS)のスケーリングなど、半導体技術の進歩に伴っており、MOSFETトランジスタはムーアの法則で説明されているのと同様のスケーリングを示しています。1980年代には、レーザー光を情報キャリアとして使用する光ファイバー技術が、通信回線の伝送速度と帯域幅を加速させました。これにより、通信ネットワークの帯域幅は毎秒テラビットの伝送速度を達成しました。[ 39 ]