マティアス・フォン・ダヴィア | |
|---|---|
| 生まれる | |
| 職業 | 心理測定学者、学者、発明家、作家 |
| 受賞歴 | ETS科学者賞、教育試験サービス(2006年) 教育測定への貢献に対するブラッドリー・ハンソン賞、全米教育測定協議会(2012年) 教育測定と研究方法論への重要な貢献に対する賞、アメリカ教育研究協会(AERA)(2017年) |
| 学歴 | |
| 教育 | 心理学修士、 Dr. rer. nat. |
| 母校 | キール大学 |
| 学術研究 | |
| 機関 | TIMSS & PIRLS 国際研究センター、ボストン大学リンチ教育人間開発学部 |
マティアス・フォン・ダヴィアは、心理測定学者、学者、発明家、そして作家です。リンチ教育人間開発学部のTIMSS & PIRLS国際研究センターのエグゼクティブディレクターであり、ボストン大学のJ・ドナルド・モナン神父(教育学教授)でもあります。[1]
フォン・ダヴィアの研究は、複雑な教育データや調査データを分析するための高度な心理測定モデルと方法論の開発に焦点を当てています。130以上の研究論文、章、研究報告書を執筆・共著しており、6冊の著書を有しています。その中には、自身が共同編集したMethodology of Educational Measurement and Assessmentシリーズの一部であるAdvancing Human Assessmentも含まれています。 [2]また、2006 ETS Research Scientist award、[3] 2012 National Council on Measurement in Education (NCME) Brad Hanson Award for Contributions to Educational Measurement、[4] AERA Division-D 2017 Award for Significant Contribution to Measurement and Research Methodology(著書Handbook of International Large-Scale Assessment ) [5]など、数々の賞を受賞しています。
フォン・ダヴィアは2021年からアメリカ教育研究協会(AERA)のフェローであり[6] 、 2022年からは全米教育アカデミーの会員に選出されています[7]。彼は2つの主要な科学雑誌、 British Journal of Mathematical and Statistical PsychologyとPsychometrikaの編集者を務め[8]、IEAとETSの共同出版物であるSpringerジャーナルLarge-Scale Assessments in Educationの創刊編集者2人のうちの1人でした。[9]また、フォーダム大学のアン・アナスタシ講演会、[10]ドバイの第9回IEA国際研究会議、[11]中国南昌の教育測定に関する海峡横断会議、コネチカット大学の国際心理測定学会会議、[12]ミュンヘンのルートヴィヒ・マクシミリアン大学、[13]経済協力開発機構の基調講演者として招待されている。[14]
教育と初期のキャリア
フォン・ダヴィアは1993年にキール大学数学・理学部(Mathematisch-Naturwissenschaftlichen Fakultät)で心理学の修士号を優秀な成績で取得した。その後、 1996年に同学部で心理学の博士号(Dr. rer. nat. )を取得した。[15]
フォン・ダヴィアのキャリアは、キール大学科学教育研究所(IPN)のアシスタント研究員として始まりました。その後、ニュージャージー州プリンストンの教育試験サービス(ETS)でポストドクター研究員として研究を行い、複雑なIRTモデルの項目適合度尺度を開発しました。2000年11月から2004年4月まで、プリンストンETSのグローバル評価センターの研究員に就任しました。[16]
キャリア
2004年、フォン・ダヴィアはプリンストン大学グローバルアセスメントセンターの上級研究科学者に就任し、成果に基づくモデルの評価に焦点を当てた取り組みを主導しました。教育テストサービス(ETS)内で様々な役職を歴任した後、2007年には上級研究科学者に就任しました。同時に、全国教育進歩評価(NAEP)タスクオーダーコンポーネントのテクニカルディレクターを務め、ETS/IEA研究所のバーチャルリサーチラボの管理も行いました。その他にも、2007年5月には主任研究科学者に就任しました。[17]
フォン・ダヴィエは2011年6月にグローバル評価センターの研究ディレクターに任命され、国際調査評価研究を監督し、ETS研究イニシアチブの共同リーダーとして主導しました。2013年9月からはグローバル評価センターの共同ディレクターを務め、2014年10月からは上級研究ディレクターも兼任しています。2017年1月には、フィラデルフィアの全米医師資格審査委員会(NBME)の著名研究科学者に就任しました。[18] 2020年9月からは、ボストン大学リンチ教育人間開発学部のTIMSS & PIRLS国際研究センターのエグゼクティブディレクターを務めており、同大学のJ・ドナルド・モナン神父教育学大学教授も務めています。[19]
方法論的研究
フォン・ダヴィアの研究分野には、項目反応理論(IRT)、潜在クラス分析、診断分類モデルが含まれており、より広範には分類と混合分布モデル、計算統計、人物適合、項目適合、モデル検査、カテゴリデータ分析のための階層モデル拡張に重点を置いています。[20]
心理測定学的方法論に焦点を当てたフォン・ダヴィアの定量的方法論的研究はいくつかの特許を取得している。[21] [22] [23] [24]
心理測定理論への貢献
フォン・ダヴィエの心理測定学における研究は、モデル開発、モデル適合、そして複雑なデータ収集設計における潜在変数モデルの並列計算と推定を含む推定法を中心に展開してきた。主な例としては、様々な多値ラッシュモデルの条件付き最大尤度推定、混合分布ラッシュモデルの拡張、多値ハイブリッドモデルなど、ラッシュモデルを中心としたモデル拡張への貢献が挙げられる。 [25]彼は、人、項目、モデル適合評価を含む潜在変数モデルの適合評価に取り組んできた。その他の貢献の中でも、一般診断モデル [26]は、2値および多値データ、ならびに2値および多値順序属性に対する柔軟な診断分類モデルと考えられている。彼の研究には、Parallel-E、Parallel-Mアルゴリズムも含まれている。[27] 中断規則を用いた知能検査の実施に関する基本的な結果は、フォン・ダヴィエと共同研究者によって導き出された[28]。
彼はまた、速度精度モデルの拡張を含め、達成度、無回答、プロセスデータに関する情報を統合するモデルを開発しました。[29] [30]さらに、彼の研究は、自動問題生成と自動採点における人工知能の活用にも及びました。[31] [32] [33]
応用研究
フォン・ダヴィアの応用研究は、国際的な大規模評価における心理測定手法の活用に焦点を当てています。ETSとボストンカレッジにおける職務において、彼は紙ベースとコンピュータベースの評価結果を整合させるように設計された研究データを用いたモード効果モデルを用いて、 PIAAC 2012、PISA 2015、TIMSS 2019、PIRLS 2021の傾向線を紙ベースからコンピュータベースに移行させる心理測定研究を主導しました。[34]
彼の研究のもう一つの分野は、大規模な教育評価におけるリンクというより一般的な問題に関するものである。[35] [36]
フォン・ダヴィアの3つ目の研究分野は、回答スタイルと自己申告における調査回答バイアスの修正について議論したものです。その応用範囲は、性格データの混合モデル[37] [38]から、アンカー・ビネットによる回答バイアスの修正の試みの落とし穴[39]まで多岐にわたります。近年では、彼の研究の焦点は、達成度評価の改善と評価結果の文脈化を目的として、評価におけるプロセスデータの利用に置かれています。[29] [30] [40]
出版物
フォン・ダヴィアは、査読付きジャーナル、編集書籍、モノグラフ、研究報告書シリーズなど、150以上の論文を執筆・共著しています。h指数は52です。彼は、心理測定学における潜在変数モデルから国際的な大規模評価、評価における自然言語処理まで、幅広いテーマの書籍を共同編集しています。[41]
フォン・ダヴィアの最初の著書『多変量および混合分布ラシュモデル:拡張と応用』は、教育、心理学、健康科学など、様々な分野におけるラシュモデルの高度な応用と拡張を探求した。アラン・S・コーエンはアメリカ統計学会誌で「ユルゲン・ロストの退職を記念して出版されたこの本は、項目反応理論(IRT)の分野で著名な研究者によって執筆された22の招待論文をまとめた本である」と述べている。[42]彼の次の著書『国際大規模評価の役割:技術、経済、教育研究からの視点』は2012年に出版され、人的資本の分配の役割を理解し、政策、教育、研究に影響を与える変化の触媒としての大規模な国際評価の重要性について論じた。 2013年、彼はレスリー・ルトコウスキー氏とデイヴィッド・ルトコウスキー氏と共に『国際大規模評価ハンドブック:背景、技術的課題、データ分析方法』を共同編集し、教育における国際大規模評価(ILSA)の方法論、技術的詳細、そして政策的含意を探求した。テリー・アッカーマン氏は、「本書は国際大規模評価(ILSA)に関する優れたリソースであり、ガイドである。3人の編集者は、国際テストや行動統計から教育政策に至るまで、幅広い専門知識を持つ著名な学者グループを特定するという素晴らしい仕事をした」と述べている。[43]
フォン・ダヴィアは、ランディ・E・ベネットとともに、 2017年に『Advancing Human Assessment: The Methodological, Psychological and Policy Contributions of ETS』を出版し、ETSによる人間による評価の進歩について詳述し、測定と統計、教育政策、心理学、広く使用されている教育調査と方法論の開発を網羅しています。この評価方法論の探求を基に、フォン・ダヴィアは2023年にビクトリア・ヤネバと共同で『Advancing Natural Language Processing in Educational Assessment』を編集し、教育テストと評価におけるNLPの使用の実装、利点、課題を検討しました。さらに、著書『Handbook of Diagnostic Classification Models: Models and Model Extensions, Applications, Software Packages』では、診断分類モデル(DCM)の概要を示し、従来の評価モデルと比較して、複数のスキルドメインにわたる受験者のパフォーマンスの詳細な評価を提供できるという、その開発、適用、利点について説明しています。ユ・バオはこの本をレビューし、「診断分類モデルハンドブックは、大多数の研究トピックの包括的なコレクションと、ここ数十年で影響力のある出版物の要約で構成された参考書として役立ちます」と述べています。[44]
引用数の多い研究で、フォン・ダヴィエは、大規模な国際評価のデータを分析し報告するために研究者が使用できる方法について書き、偏りのない結果を確実にするために共通の問題と統計的複雑さに対処しています。[45]彼は、偏った推定を避けるために大規模な調査データ分析で妥当な値を正しく使用することの重要性を強調し、確立された手順とガイドラインに従う必要性を強調しました。[46]さらに、最大尤度法を使用した多次元スキルプロファイルの診断モデルを提示し、シミュレーションデータと実際のデータでのその適用を実証し、[47] TOEFLインターネットベーステスト(iBT)フィールドテストデータに焦点を当て、多値データと欠損回答に適したスキルプロファイルを推定するための一般診断モデル(GDM)を紹介しました。[48]関連研究では、診断モデリングに対するG-DINAとLCDMのアプローチがGDMの特殊なケースであることを示しました。[49]彼のその後の研究の一部は、大規模言語モデル、リカレントニューラルネットワーク、その他のいわゆるAI手法と、それらが自動問題生成、自動採点、および大規模な教育評価の他のアプリケーションにどのように使用できるかに焦点を当てていました。[31] [32] [33]
賞と栄誉
- 2006年 – ETS科学者賞、ETS [3]
- 2012年 ブラッドリー・ハンソン教育測定への貢献賞、NCME [4]
- 2017年 - 教育測定と研究方法論への顕著な貢献賞、AERA [5]
参考文献
本
- 多変量および混合分布Raschモデル:拡張と応用(2007)ISBN 978-0387329161
- 国際大規模評価の役割:技術、経済、教育研究の視点(2012年)ISBN 978-9400797116
- 国際大規模評価ハンドブック:背景、技術的課題、データ分析方法(2013年)ISBN 978-1439895122
- 人間評価の推進:ETSの方法論的、心理学的、政策的貢献(2017年)ISBN 978-3319586878
- 診断分類モデルハンドブック:モデルとモデル拡張、アプリケーション、ソフトウェアパッケージ(2019)ISBN 978-3030055837
- 教育評価における自然言語処理の進歩(2023年)ISBN 978-1032244525
選択された記事
- フォン・ダヴィア、マティアス(2008年11月)「言語テストデータへの一般診断モデルの適用」英国数学統計心理学ジャーナル61 (2): 287–307 . doi :10.1348/000711007X193957. PMID 17535481.
- フォン・ダヴィア、マティアス;ゴンザレス、エウジェニオ;ミスレヴィ、ロバート・J.「妥当な値とは何か、そしてなぜそれが有用なのか」(PDF) IERIモノグラフシリーズ2 ( 1):9–36。
- ルトコウスキー, レスリー; ゴンザレス, エウジェニオ; ヨンカス, マーク; フォン・ダヴィア, マティアス (2010年3月). 「国際大規模評価データ:二次分析と報告における課題」.教育研究者. 39 (2): 142– 151. doi :10.3102/0013189X10363170.
- フォン・ダヴィア、マティアス(2018年12月)「リカレントニューラルネットワークによる自動アイテム生成」Psychometrika 83 ( 4): 847– 857. doi :10.1007/s11336-018-9608-y. PMID 29532403.
- Ulitzsch, Esther; von Davier, Matthias; Pohl, Steffi (2020年11月). 「推測と項目レベルの無回答の観点から受験者のエンゲージメントを推論するための階層的潜在反応モデル」. British Journal of Mathematical and Statistical Psychology . 73 (S1): 83– 112. doi : 10.1111/bmsp.12188 . PMID 31709521.
- ベジルハン、ウムグル;フォン・ダヴィア、マティアス (2023). 「OpenAIの大規模言語モデルを用いた自動読解文章生成」.コンピュータと教育:人工知能. 5 100161. arXiv : 2304.04616 . doi :10.1016/j.caeai.2023.100161.
- ユン・ジユン、リリアン・ティアック、マティアス・フォン・ダヴィア(2024年4月8日)「国際的な大規模評価における機械翻訳と自動採点の併用」『大規模教育評価』12 (1) 10. doi : 10.1186/s40536-024-00199-7 .
参考文献
- ^ “当社のスタッフ – マティアス・フォン・ダヴィエ”. timssandpirls.bc.edu。
- ^ 「教育測定・評価の方法論」Springer。
- ^ ab 「プレゼンター、モデレーター、討論者の略歴」(PDF)。
- ^ ab 「Awards – NCME」。www.ncme.org。
- ^ ab 「賞」. www.aera.net .
- ^ 「2021 AERAフェロー」. www.aera.net .
- ^ 「マティアス・フォン・ダヴィアが国立教育アカデミーの新会員に選出 | IEA.nl」www.iea.nl。
- ^ 「Psychometrikaの新編集長」心理測定学会. 2023年7月24日.
- ^ 「教育における大規模評価」SpringerOpen。
- ^ “アナスタシ講演会 2022 | フォーダム”. www.fordham.edu。
- ^ 「会議プログラム | IEA.nl」。www.iea.nl。
- ^ Yelie, Yuan (2023年4月17日). 「学際セミナー:マティアス・フォン・ダヴィア、ボストン大学|統計学部」
- ^ 「ゲスト講義:マティアス・フォン・ダヴィア博士 – ミュンヘン学習科学センター – LMUミュンヘン」www.en.mcls.uni-muenchen.de。
- ^ 「PIAAC方法論セミナー」(PDF)。
- ^ “Bio”. 2016年9月2日.
- ^ 「マティアス・フォン・ダヴィア | 国立教育政策センター」nepc.colorado.edu。
- ^ 「NEPS > プロジェクト概要 > アドバイザリーエキスパート > Matthias von Davier」。www.neps-data.de。
- ^ “当社のスタッフ – マティアス・フォン・ダヴィエ”. timssandpirls.bc.edu。
- ^ 「Matthias von Davier氏に会う – リンチ教育人間開発学部」ボストン大学。
- ^ 「マティアス・フォン・ダヴィア – リンチ教育人間開発学部」ボストン大学。
- ^ 「一般化潜在変数モデルを使用したデータ分析のための並列コンピューティング」。
- ^ 「多言語テキストシーケンスを評価するためのシステムと方法」。
- ^ 「混合一般診断モデル」。
- ^ 「大規模調査分析のためのシステムと方法」www.ets.org。
- ^ フォン・デイヴィア、マティアス;ロスト、ユルゲン (1995)。 「多頭混合ラッシュモデル」。ラッシュモデル。 pp. 371–379。土井:10.1007/978-1-4612-4230-7_20。ISBN 978-1-4612-8704-9。
- ^ フォン・ダヴィア、マティアス(2014年2月)「制約付き一般診断モデルとしてのDINAモデル:モデル等価性の2つのバリエーション」英国数学統計心理学ジャーナル67 ( 1): 49–71 . doi :10.1111/bmsp.12003. PMID 23297749.
- ^ フォン・ダヴィア、マティアス(2016年12月)「高性能心理測定:一般化潜在変数モデルのためのParallel-E Parallel-Mアルゴリズム」ETS研究報告シリーズ2016 (2): 1– 11. doi :10.1002/ets2.12120.
- ^ von Davier, Matthias; Cho, Youngmi; Pan, Tianshu (2019年3月). 「テストスコアの心理測定特性に対する中断ルールの影響」Psychometrika . 84 (1): 147– 163. doi :10.1007/s11336-018-09652-3. PMID 30607661.
- ^ ab Ulitzsch, Esther; von Davier, Matthias; Pohl, Steffi (2020年11月). 「推測と項目レベルの無回答の観点から見た受験者のエンゲージメントに関する推論のための階層的潜在反応モデル」. British Journal of Mathematical and Statistical Psychology . 73 (S1): 83– 112. doi : 10.1111/bmsp.12188 . PMID 31709521.
- ^ ab Leng, Dihao; Bezirhan, Ummugul; Khorramdel, Lale; Fishbein, Bethany; Davier, Matthias von (2024年9月). 「複数グループ階層的速度・正確性・再訪問モデルを用いたTIMSS 2019における男女差の検討」『教育測定:課題と実践』43 (3): 64– 75. doi : 10.1111/emip.12606 .
- ^ ab von Davier, Matthias (2018年12月). 「リカレントニューラルネットワークによる自動アイテム生成」. Psychometrika . 83 (4): 847– 857. doi :10.1007/s11336-018-9608-y. PMID 29532403.
- ^ ab Bezirhan, Ummugul; von Davier, Matthias (2023). 「OpenAIの大規模言語モデルを用いた自動読解文章生成」. Computers and Education: Artificial Intelligence . 5 100161. arXiv : 2304.04616 . doi :10.1016/j.caeai.2023.100161.
- ^ ab Jung, Ji Yoon; Tyack, Lillian; von Davier, Matthias (2024年4月8日). 「国際的な大規模評価における機械翻訳と自動採点の併用」.大規模教育評価. 12 (1) 10. doi : 10.1186/s40536-024-00199-7 .
- ^ フォン・ダヴィア、マティアス、コラムデル、ラレ、何、チーウェイ、シン、ヒョジョン、チェン、ハイウェン(2019年12月)。「テクノロジーを活用した大規模評価のための心理測定人口モデルの発展:課題と機会の概要」教育行動統計ジャーナル44 ( 6): 671– 705. doi :10.3102/1076998619881789.
- ^ フォン・ダヴィア(マティアス・フォン・ダヴィア)、山本健太郎(ヤマモト・ケンタロウ)、シン・ヒョジョン(シン・ヒョジョン)、チェン・ヘンリー(チェン・ヘンリー)、コラムデル・ラレ(コラムデル・ラレ)、ウィークス・ジョン(ウィークス)、デイビス・スコット(デイビス・スコット)、コン・ナン(コン・ナン)、カンダシル・マット(カンダシル・マット)(2019年7月4日)。「PISA2000-2012データにおける項目反応理論のリンクとモデル適合性の評価」 『教育における評価:原則、政策、実践』26 (4): 466– 488. doi :10.1080/0969594X.2019.1586642.
- ^ 「PISA 2022技術報告書」(PDF) .
- ^ ロスト、ユルゲン、カーステンセン、マティアス・フォン・ダヴィア (1997). 「混合ラッシュモデルの性格質問票への適用」 ロスト、ユルゲン編著『潜在特性モデルと潜在クラスモデルの社会科学への応用』 ワックスマン、pp. 324– 332. ISBN 978-3-89325-464-4。
- ^ フォン・ダヴィア、マティアス、ナエミ、リチャード・D・ロバーツ(2012年10月)「因子モデルと類型モデル:性格データのための手法の比較」『測定:学際的研究と展望』10 (4): 185– 208. doi :10.1080/15366367.2012.732798.
- ^ フォン・ダヴィア, マティアス; シン, ヒョジョン; コラムデル, ラレ; スタンコフ, ラザール (2018年6月). 「ヴィネットスコアリングが自己報告の信頼性と妥当性に及ぼす影響」.応用心理測定. 42 (4): 291– 306. doi :10.1177/0146621617730389. PMC 5978608. PMID 29881126 .
- ^ Pohl, Steffi; Ulitzsch, Esther; von Davier, Matthias (2021年4月23日). 「教育評価におけるランキングの再構築」. Science . 372 (6540): 338– 340. Bibcode :2021Sci...372..338P. doi :10.1126/science.abd3300. PMID: 33888624.
- ^ “マティアス・フォン・ダヴィエ”.学者.google.com。
- ^ ブラッドストリート, トーマス・E.; コーエン, アラン・S.; アンダーソン=クック, クリスティン・M.; クック, ジョン・R.; ロビンソン, ティモシー・J.; キャバノー, ジョセフ; エンブレヒツ, ポール; オルソン, ジェイコブ・J. (2008). 「テレグラフィック・レビュー」 .アメリカ統計学会誌. 103 (481): 433– 436. doi :10.1198/jasa.2008.s227. JSTOR 27640065.
- ^ Ackerman, Terry (2015年7月3日). 「Rutkowski, L., von Davier, M., & Rutkowski, D. (編). (2009). 国際大規模評価ハンドブック:背景、技術的問題、データ分析方法. ニューヨーク: CRC Press. International Journal of Testing . 15 (3): 274– 289. doi :10.1080/15305058.2015.1034867.
- ^ Bao, Yu; Mireles, Nicolas Emundo (2023年10月2日). 「診断分類モデルハンドブック:モデルとモデル拡張、アプリケーション、ソフトウェアパッケージ」 Matthias von Davier著、Young-Sun Lee著、ニューヨーク、Springer、2019年、656ページ、ISBN: 978-3-030-05583-7. 『測定:学際的研究と展望』 . 21 (4): 282– 285. doi :10.1080/15366367.2022.2159686.
- ^ Rutkowski, Leslie; Gonzalez, Eugenio; Joncas, Marc; von Davier, Matthias (2010年3月). 「国際大規模評価データ:二次分析と報告における課題」.教育研究者. 39 (2): 142– 151. doi :10.3102/0013189X10363170.
- ^ von Davier, Matthias; Gonzalez, Eugenio; Mislevy, Robert (2009年1月30日). 「妥当な値とは何か、そしてなぜそれが有用なのか?」(PDF) . ETS研究報告シリーズ.
- ^ フォン・ダヴィア、マティアス(2008年11月)「言語テストデータへの一般診断モデルの適用」英国数学統計心理学ジャーナル61 (2): 287–307 . doi :10.1348/000711007X193957. PMID 17535481.
- ^ フォン・ダヴィア、マティアス(2005年12月)「言語テストデータへの一般診断モデルの適用」ETS研究報告シリーズ、2005年(2):i–35。doi : 10.1002/j.2333-8504.2005.tb01993.x。
- ^ フォン・ダヴィア、マティアス(2014年12月)「一般診断モデル(GDM)の特殊ケースとしての対数線形認知診断モデル(LCDM)」ETS研究報告シリーズ。2014 (2):1-13。doi : 10.1002 /ets2.12043。