児童音声コーパスとは、母語習得を記録した音声コーパスです。このようなデータベースは、コンピュータ支援言語学習システムの開発や、様々な年齢における児童の音声の特徴づけに利用されています。[1]児童の音声は言語によって異なるだけでなく、言語内の地域によっても異なります。また、自閉症児のような特定の集団では、特に感情を考慮すると、音声が異なる場合もあります。そのため、異なる集団には異なるデータベースが必要です。アメリカ英語とイギリス英語のコーパスに加え、多くのヨーロッパ言語のコーパスも利用可能です。[1] [2] [3]
児童音声コーパスの概要
以下の表では、年齢範囲を学年で表記しています。「K」は「幼稚園」、「G」は「学年」を表します。例えば、「K - G10」という年齢範囲は、幼稚園から10年生までの話者を指します。
この表は、2016年のインタースピーチ会議の論文に基づいています。[4]このオンライン記事は、読者にインタラクティブな表を提供し、音声研究コミュニティによって継続的に更新される子供の音声コーパスに関する情報の場を提供することを目的としています。
| コーパス | 著者 | 言語 | # スピーカー | # うーん。 | 間隔 | 年齢層 | 日付 | 備考 |
|---|---|---|---|---|---|---|---|---|
| ボルダーラーニング—MySTコーパス(v0.4.0)[5] | コールら[6] | 英語 | 1371 | 228,874 | 約393時間 | G3 - G5 | 2019 | 科学の話題に関する学生と仮想チューターとの対話。セッションの長さは通常 20 ~ 40 分 (壁時計)。発言の約 49% が文字起こしされており、さらに文字起こし中です。ボランティアを募集しています。研究目的では無料でご利用いただけます。商用利用の場合は一律 1 万ドルです。 |
| CMUキッズコーパス[7] | エスケナジ | 英語 | 24歳男性、52歳女性 | 5180 | 6~11歳 | 1997 | ||
| CSLU子供のスピーチコーパス[8] | ショバキ | 英語 | 1100 | 1017 | K - G10 | 2007 | ||
| PF-STAR児童音声コーパス[9] [10] | ラッセル | 英語、 | 158 | 約14.5時間 | 4~14歳 | 2006 | 単語レベルの転写 | |
| コールSLT [11] | レイナー | ドイツ語 | 5000 | 2014 | ||||
| ティーボール[12] | カゼムガデ | 英語 | 256 | 5000 | 40時間 | K - G4 | 2005 | 部分的に非ネイティブなスピーチ |
| キャス・チャイルド[13] | ガオ | 北京語 | 23 | 1 - 4 | 2012 | 音声転写 | ||
| CU児童向け読み聞かせ・促し音声コーパス[14] | ハーゲン | 英語 | 663 | 約100 | K - G5 | 2001 | 独立した単語、文、短い自発的な物語の語りで構成され、単語レベルの書き起こし | |
| CUストーリーコーパス[14] | ハーゲン | 英語 | 106 | 5000 | 40時間 | G3 - G5 | 2003 | 物語のプロンプトと、その内容の自発的な要約で構成され、単語レベルの書き起こしが収録されている。 |
| プロビデンス・コーパス[15] | デムス | 英語 | 6 | 363時間 | 1 - 3 | 2006 | 母子間の自発的な会話のやり取り;広範囲の音声転写 | |
| リヨン・コーパス[16] | デムス | フランス語 | 4 | 185時間 | 1 - 3 | 2007 | 母子間の自発的な会話のやり取り;広範囲の音声転写 | |
| デムス・セソト語コーパス[17] | デムス | セソト語 | 4 | 約13250 | 98時間 | 2 - 4 | 1992 | 家族/仲間の自発的な会話のやり取り; 形態学的にタグ付け |
| チーデ[18] | ガロテ | スペイン語 | 59 | 15444 | 約8時間 | 2008 | 自発的な会話、個人面接、大人と子供の交流、綴り書き起こし、自動音韻書き起こし | |
| ティディジッツ[19] | レナード | 英語 | 326人(子供101人) | 6~15歳 | 1993 | 大人と子供の話者の混合 | ||
| FAU Aibo感情コーパス | シュタイドル | ドイツ語 | 51 | 9時間 | 10~13歳 | 11の感情カテゴリーで人間による注釈が付けられている | ||
| スウェーデン語NICEコーパス[20] | ベル | スウェーデン語 | 5580 | 8~15歳 | 2005 | 子供と機械、大人と子供のやりとりで構成される。正書法による転写 | ||
| シンガキッズ中国語[4] | チェン | 北京語 | 255 | 79,843 | 125時間 | 7~12歳 | 2016 | 単語および音素レベルの書き起こし、人間による注釈付きの熟達度評価 |
| CFSC [21] | パスクアル | フィリピン人 | 57 | 約8時間 | 6-11 | 2012 | 子供の読み上げ音声で構成され、正しい発音と読み間違いの両方を含み、単語レベルと音素レベルに部分的に転写されています。 |
参照
参考文献
- ^ ab Habernal, Ivan; Vaclav, Matousek (2013). テキスト、音声、対話:第16回国際会議TSD 2013、チェコ共和国ピルゼン、2013年9月1日~5日、議事録. Springer. 545頁. ISBN 9783642405853. 2015年12月11日閲覧。
- ^ ノイスタイン、エイミー (2014).医療における音声とオートマトン。ウォルター・デ・グルイテル。ページ 225–226。ISBN 9781614515159. 2015年12月11日閲覧。
- ^ Ronzhin, Andrey; Potapova, Rodmonga; Fakotakis, Nikos (2015). 音声とコンピュータ:第17回国際会議 SPECOM 2015, アテネ, ギリシャ, 2015年9月20日~24日, Proceedings. Springer. pp. 144– 145. ISBN 9783319231327. 2015年12月11日閲覧。
- ^ ab Nancy F. Chen、Rong Tong、Darren Wee、Peixuan Lee、Bin Ma、Haizhou Li. SingaKids-Mandarin: 北京語を話すシンガポール児童の音声コーパス、Interspeech誌、2016年。
- ^ 「MyST Corpus | Boulder Learning inc」 。 2019年7月17日閲覧。
- ^ 「My Science TutorとMySTコーパス」ResearchGate . 2019年7月17日閲覧。
- ^ マキシン・エスケナジー、ジャック・モストウ、デイヴィッド・グラフ著. CMUキッズコーパスLDC97S63. Webダウンロード. フィラデルフィア: 言語データコンソーシアム, 1997.
- ^ Khaldoun Shobaki、John-Paul Hosom、Ronald Cole. CSLU: Kids' Speech Version 1.1 LDC2007S18. Webダウンロード. フィラデルフィア: Linguistic Data Consortium, 2007.
- ^ マーティン・ラッセル. PF-STAR イギリス英語児童音声コーパス. スピーチアーク・リミテッド. 2006.
- ^ アントン・バトライナー、マッツ・ブロンバーグ、ショーナ・ダーシー、ダニエル・エレニウス、ディエゴ・ジュリアーニ、マッテオ・ジェローザ、クリスチャン・ハッカー、マーティン・ラッセル、ステファン・シュタイドル、マイケル・ウォン。PF STAR児童音声コーパス。Interspeech誌、2005年。
- ^ マニー・レイナー、ニコス・ツォラキス、クラウディア・バウアー、ピエレット・ブイヨン、ヨハンナ・ゲルラッハ。CALL -SLT:文法と音声認識に基づく音声CALLシステム。『言語技術における言語的問題』第10巻第2号、2014年。
- ^ Abe Kazemzadeh、Hong You、Markus Iseli、Barbara Jones、Xiaodong Cui、Margaret Heritage、Patti Price、Elaine Anderson、Shrikanth Narayanan、Abeer Alwan . TBALLデータ収集:幼児の音声コーパスの作成、Interspeech誌、2005年。
- ^ Jun Gao、Aijun Li、Ziyu Xiong.北京語マルチメディア児童音声コーパス:CASS_CHILD、国際音声データベース・評価会議(Oriental COCOSDA)、2012年。
- ^ ab Andreas Hagen、Bryan Pellom、Ronald Cole。「児童音声認識とインタラクティブブックおよびチューターへの応用」 IEEE自動音声認識・理解ワークショップ、2003年。
- ^ Demuth, K. , Culbertson, J. & Alter, J. 2006. 「英語習得における語の最小性、エペンセシス、コーダライセンス」Language & Speech, 49, 137-174.
- ^ Demuth, K. & A. Tremblay. 2007. 「フランス語の限定詞の発音における韻律的条件付けによる変動」Journal of Child Language, 34, 1-29.
- ^ Demuth, K. 1992. セソト語の習得. D. Slobin編『言語習得の相互言語的研究』第3巻, 557-638ページ. ヒルズデール, ニュージャージー州: Lawrence Erlbaum Associates.
- ^ マルタ・ガローテ。CHIEDE: スペイン語の児童自発言語コーパス。博士号博士論文、マドリッド自治大学、スペイン。 2008年。
- ^ R. Gary Leonard、George Doddington. TIDIGITS LDC93S10. Webダウンロード. フィラデルフィア: Linguistic Data Consortium, 1993.
- ^ Linda Bell、Johan Boyce、Joakim Gustafson、Mattias Heldner、Anders Lindström、Mats Wirén.スウェーデン語NICEコーパス - コンピュータゲームシナリオにおける子供と実体キャラクター間の音声対話, Proc. of Eurospeech, 2005.
- ^ Pascual, RM; Guevara, RCL (2012年11月). 「読み間違いや流暢でない話し方の自動検出に応用するためのフィリピン語児童音声コーパスの開発」TENCON 2012 IEEE Region 10 Conference . pp. 1– 6. doi :10.1109/TENCON.2012.6412235. ISBN 978-1-4673-4824-9. S2CID 8795591。