汚れたデータ

ダーティデータ(不正データとも呼ばれる)[ 1]とは、特にコンピュータシステムやデータベースにおいて、不正確、不完全、または矛盾したデータである。[2]

ダーティデータには、スペルミスや句読点の誤り、フィールドに関連付けられた誤ったデータ、不完全または古いデータ、さらにはデータベース内で重複したデータなどが含まれる場合があります。これらは、データクレンジングと呼ばれるプロセスによってクリーンアップできます。[3]

ダーティデータ(社会科学)

社会学において、ダーティデータとは、その発見によってデータを秘密にしていた者の信用を失墜させるような秘密データを指します。MIT名誉教授ゲイリー・T・マルクス氏の定義によれば、ダーティデータは以下の4種類のデータのうちの1つです。[4] [5] [6]

  • 秘密性がなく信用を失墜させるものではないデータ:
    • 定期的に利用可能な情報。
  • 秘密かつ信用を失墜させないデータ:
    • 戦略的かつ兄弟的な秘密、プライバシー。
  • 秘密性がなく信用を失墜させるデータ:
    • 制裁免除、
    • 規範的不一致、
    • 選択的な意見の相違、
    • 信頼性に対する脅迫を実行する、
    • 汚れたデータを発見しました。
  • 秘密かつ信用を失墜させるデータ: 隠された汚れたデータ。

参照

参考文献

  1. ^ Spotless バージョン 12 がリリースされました
  2. ^ チュー、マーガレット・Y. (2004). 『至福のデータ:すべての従業員に意味があり、有用で、アクセスしやすいデータを提供するための知恵と戦略』ニューヨーク:AMACOM. p. 71. ISBN 978-0-8144-0780-6
  3. ^ Wu, S. (2013)、「粗保証データと分析のレビュー」(PDF)信頼性工学とシステム1141– 11、doi:10.1016/j.ress.2012.12.021
  4. ^ 「隠された情報の発見、収集、評価に関するメモ」web.mit.edu . 2017年2月17日閲覧
  5. ^ ウォルビー、ケビン、ラーセン、マイク (2012年1月1日). 「情報へのアクセスと情報公開請求:社会科学における見過ごされてきたデータ生産手段」 .質的調査. 18 (1): 31– 42. doi :10.1177/1077800411427844. ISSN  1077-8004.
  6. ^ Roe, David (2021年4月27日). 「最も一般的なダーティデータの種類とは?」DMCoding .


Retrieved from "https://en.wikipedia.org/w/index.php?title=Dirty_data&oldid=1292153365"