PVLV

一次価値学習価値（PVLV）モデルは、ドーパミン（DA）ニューロンの報酬予測発火特性を説明する可能性のあるモデルである。 ^{[1]このモデルは}、パブロフの条件付けと、予期せぬ報酬に比例して発火する中脳ドーパミンニューロンに関する行動および神経学的データをシミュレートする。これは、時間的差異（TD）アルゴリズムの代替となる。^[2]

Leabraの一部として使用されます。