This article needs additional citations for verification. (March 2020) |
スコットランド・テキスト・スピーチ・コーパス(SCOTS )は、スコットランド英語とスコットランド語の様々な方言による現代(1940年以降)の書き言葉と話し言葉のコーパスを構築するための継続的なプロジェクトです。SCOTSは2004年11月からオンラインで利用可能で、自由に検索・閲覧できます。2015年までに470万語に達しました。[1]
このプロジェクトは、グラスゴー大学英語学科とSTELLAプロジェクトによるベンチャーです。SCOTSは、芸術・人文科学研究会議の助成金を受けています。
言語の多様性
SCOTSには、スコットランド英語と、ドリス語、ララン語、グラスゴー語、島嶼スコットランド語などの都市部方言を含む広域スコットランド語のテキストが含まれています。SCOTSには、テキストの地理的分布と人口統計的分布が含まれています。各テキストには、著者の生誕10年、性別、職業、出生地、居住地などの情報、出版情報、読者、日付、ジャンルなどのテキストに関する詳細を含む、広範なメタデータが付随しています
ジャンルとモード
SCOTSは、書き言葉と音声テキストを含むマルチメディア コーパスです。書き言葉と音声テキストは、正書法による転写として利用可能で、ソースの音声ファイルまたはビデオファイルが付属しています。SCOTSには、散文小説、詩、ビジネスおよび個人的な書簡、宗教文書、議会および行政文書、電子メール、会話、インタビューなど、多数の ジャンルとテキストタイプが含まれています
検索と分析
SCOTSは、ユーザーの興味に応じてさまざまな方法で調査できます。コーパスは、著者名やテキストの日付などで閲覧でき、すべてのテキストはプレーンテキスト形式 でダウンロードできます
文字起こしはオーディオ/ビデオ ファイルと同期され、ストリーミングされ、ダウンロードすることもできます。
高度な検索機能を使用すると、メタデータで利用可能なすべてのフィールドから選択して、より複雑なクエリを作成できます。地理的な結果はインタラクティブな地図上にプロットされるため、地域差を調査できます。
詳細検索の結果は、 KWICコンコーダンスとして表示することもでき、コロケーションパターンを強調表示するために並べ替えることができます。
参考文献
外部リンク
- 公式サイト