This article needs additional citations for verification. (December 2024) |
統計学や経験科学において、データ生成プロセスとは、現実世界において関心のあるデータを「生成する」プロセスのことである。[1]このプロセスには、観測データの生成に寄与する根本的なメカニズム、要因、ランダム性が含まれる。通常、学者は実際のデータ生成モデルを知らず、代わりに仮定、近似、または推論モデルに頼って観測データを効果的に分析および解釈する。しかし、それらの実際のモデルには観測可能な結果があると仮定されている。それらの結果とは、母集団におけるデータの分布である。それらの分布またはモデルは、数学関数によって表すことができる。データ分布の関数は多数存在する。たとえば、正規分布、ベルヌーイ分布、ポアソン分布などである。
参考文献
- ^ Tu, Jun; Zhou, Guofu (2004). 「データ生成プロセスの不確実性:ポートフォリオ決定にどのような影響を与えるか?」 Journal of Financial Economics . 72 (2): 385– 421. doi :10.1016/j.jfineco.2003.05.003.
- https://stats.stackexchange.com/questions/443320/データ生成プロセスDGPの実際の意味