機械生成データ

機械生成データとは、人間の積極的な介入なしに、コンピュータプロセス、アプリケーション、またはその他のメカニズムによって自動的に生成される情報です。この用語は50年以上前に遡りますが、 ^[¹^]現在、その範囲については明確な定義が定まっていません。モナッシュ研究所のカート・モナッシュは、これを「完全に機械によって生成されたデータ、または人間の選択を記録するよりも、人間を観察することに重点を置いているデータ」と定義しています。^[²^] 一方、イェール大学のコンピューターサイエンス教授であるダニエル・アバディは、より狭い定義を提案しています。「機械生成データとは、独立した計算主体の判断の結果として、または人間の行動によって引き起こされないイベントの測定によって生成されるデータである」と。^[³^]定義の違いにかかわらず、どちらも人間が手動で入力したデータを除外します。^[⁴^]機械生成データはあらゆる産業分野に広がっています。人間は、自分の行動がデータを生み出していることに気づかないことが多くなりつつあります。^[⁵^]

成長

2009年、ガートナーは、今後5年間でデータが650%増加すると発表しました。^{[ 8 ]} データの増加の大部分は、機械生成データの副産物です。^{[ 4 ]} IDCは、2020年には接続されるモノの数が人の26倍になると推定しました。^{[ 9 ]} Wikibonは、 2020年にインダストリアルインターネットに5140億ドルが費やされるとの予測を発表しました。^{[ 10 ]}

処理

機械生成データは静的ながらも膨大な量であるため、データ所有者は、生成されたデータセットを処理・分析するために、高度にスケーラブルなツールに依存しています。機械生成データのほとんどは非構造化されていますが、共通の構造に導出されます。^{[ 4 ]} 通常、これらの導出構造には多数のデータポイント／列が含まれます。これらのデータポイントの場合、課題は主にデータの分析にあります。高いパフォーマンス要件と大規模なデータサイズを考慮すると、従来のデータベースのインデックス作成とパーティション分割では、処理対象となるデータセットのサイズと履歴が制限されます。列指向データベースでは、特定の分析時にデータセットの特定の「列」のみにアクセスできるため、代替アプローチが存在します。

例

ウェブサーバーのログ^{[ 11 ]}
通話詳細記録^{[ 11 ]}
金融商品取引^{[ 11 ]}
ネットワークイベントログ^{[ 11 ]}
セキュリティ、ネットワーク、OS ソースからセキュリティ情報イベント管理(SIEM) システムに送信されるログ
政府によって収集されたテレメトリ^{[ 11 ]}

注記

参考文献リスト

^制御システム機能とプログラミングアプローチ：応用編、ディミトリス・N・チョラファス著、アカデミック・プレス、1966年1月1日、ISBN 978-0-08-095534-6。
^モナッシュ、2010年12月30日
^アバディ
^ ^a ^b ^cモナッシュ大学、データの3つの広範なカテゴリー
^デローチ、機械生成データ
^連邦証拠審査、機械生成データは陳述ではなく伝聞証拠にはならない
^ Seth Grimes [@SethGrimes] (2016年3月8日). 「機械生成データはモノのインターネット（#IoT）の生命線：重要だが見落とされている点」（ツイート）– Twitter経由。
^サイエンスロジック
^ [1]、チャックのブログ
^ [2]、ウィキボン
^ ^a ^b ^c ^d ^eモナッシュ大学、機械生成データの例

参考文献

アバディ、ダニエル。「機械生成データ vs. 人間生成データ」。BlogSpot。
デローチ、ドン. 「機械生成データ」 . Infobright, Inc.
連邦証拠審査。「機械生成データは供述ではなく、伝聞証拠や対立を生じさせない」。
モナッシュ、カート。「データの3つの広範なカテゴリー」モナッシュ・リサーチ。
モナッシュ、カート。「機械生成データの例」モナッシュ・リサーチ。
モナッシュ、カート。「機械生成データの例と定義」モナッシュ・リサーチ。
サイエンスロジック。「ガートナー社の注目すべき10のテクノロジー」

[1] 制御システム機能とプログラミングアプローチ：応用編、ディミトリス・N・チョラファス著、アカデミック・プレス、1966年1月1日、ISBN 978-0-08-095534-6。

[2] モナッシュ、2010年12月30日

[3] アバディ

[dbms2example-4] モナッシュ大学、データの3つの広範なカテゴリー

[5] デローチ、機械生成データ

[6] 連邦証拠審査、機械生成データは陳述ではなく伝聞証拠にはならない

[7] Seth Grimes [@SethGrimes] (2016年3月8日). 「機械生成データはモノのインターネット（#IoT）の生命線：重要だが見落とされている点」（ツイート）– Twitter経由。

[sciencelogic-8] サイエンスロジック

[9] [1]、チャックのブログ

[10] [2]、ウィキボン

[monashexamples-11] モナッシュ大学、機械生成データの例

[

[

[

[

[

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

機械生成データ

関連性

成長

処理

例

注記

参考文献リスト

参考文献