ダーティデータ(不正データとも呼ばれる)[ 1]とは、特にコンピュータシステムやデータベースにおいて、不正確、不完全、または矛盾したデータである。[2]
ダーティデータには、スペルミスや句読点の誤り、フィールドに関連付けられた誤ったデータ、不完全または古いデータ、さらにはデータベース内で重複したデータなどが含まれる場合があります。これらは、データクレンジングと呼ばれるプロセスによってクリーンアップできます。[3]
ダーティデータ(社会科学)
社会学において、ダーティデータとは、その発見によってデータを秘密にしていた者の信用を失墜させるような秘密データを指します。MIT名誉教授ゲイリー・T・マルクス氏の定義によれば、ダーティデータは以下の4種類のデータのうちの1つです。[4] [5] [6]
- 秘密性がなく信用を失墜させるものではないデータ:
- 定期的に利用可能な情報。
- 秘密かつ信用を失墜させないデータ:
- 戦略的かつ兄弟的な秘密、プライバシー。
- 秘密性がなく信用を失墜させるデータ:
- 制裁免除、
- 規範的不一致、
- 選択的な意見の相違、
- 信頼性に対する脅迫を実行する、
- 汚れたデータを発見しました。
- 秘密かつ信用を失墜させるデータ: 隠された汚れたデータ。
参照
参考文献
- ^ Spotless バージョン 12 がリリースされました
- ^ チュー、マーガレット・Y. (2004). 『至福のデータ:すべての従業員に意味があり、有用で、アクセスしやすいデータを提供するための知恵と戦略』ニューヨーク:AMACOM. p. 71. ISBN 978-0-8144-0780-6。
- ^ Wu, S. (2013)、「粗保証データと分析のレビュー」(PDF)、信頼性工学とシステム、114:1– 11、doi:10.1016/j.ress.2012.12.021
- ^ 「隠された情報の発見、収集、評価に関するメモ」web.mit.edu . 2017年2月17日閲覧。
- ^ ウォルビー、ケビン、ラーセン、マイク (2012年1月1日). 「情報へのアクセスと情報公開請求:社会科学における見過ごされてきたデータ生産手段」 .質的調査. 18 (1): 31– 42. doi :10.1177/1077800411427844. ISSN 1077-8004.
- ^ Roe, David (2021年4月27日). 「最も一般的なダーティデータの種類とは?」DMCoding .