
Indigenous Tweetsは、少数言語話者同士の交流を支援するために、少数言語のTwitterメッセージを記録するウェブサイトです。2011年3月、米国ミズーリ州セントルイスにあるセントルイス大学数学・コンピュータサイエンス学部で計算言語学を研究するケビン・スキャンネル氏によって設立されました。 [ 1 ] [ 2 ]このウェブサイトの目的は、少数言語話者がインターネット上でコミュニケーションできるようにすることです。[ 3 ]
ウェブサイトのホームページには、キャッシュされている少数言語のリストが表示されています。言語を選択すると、その言語でツイートしているすべてのユーザーの一覧が表示されます。Indigenous Tweetsは、各Twitterユーザーのプロフィール写真とフォロワー数に関する統計情報を提供しています。また、ユーザーが様々な言語でツイートしている割合に関する統計情報に加え、様々な少数言語におけるトレンドトピックも提供しています。[ 3 ]
2011年3月のウェブサイト開設時には、35の言語がカタログ化されていました。[ 3 ] 2011年4月16日には、76の少数民族言語でのツイートが記録されました。[ 4 ] 2011年4月26日には、ウェブサイトは82の言語をサポートしました。 [ 5 ]カタログ化された言語には、「難解な」ガミラアイ語と「よく知られている」ハイチのクレオール語とバスク語が含まれており、[ 6 ]それぞれ1位と2位のツイート数です。[ 7 ]ウェールズ語は先住民のツイートで3位にランクされています。[ 7 ]
2011年4月の最終週に7位にランクされたカパンパンガン語は、このウェブサイトでサポートされた最初のフィリピン語でした。 [ 5 ]
多くの人々は、機械翻訳やソーシャル ネットワーキングなどのテクノロジーを、世界の言語やアメリカ文化、英語文化を促進するものだと感じ、不安な気持ちで見ています。
Twitterやソーシャルメディアのようなものは、より小さな言語にとってのチャンスだと私は考えています。Indigenous Tweetsのようなサイトは、人々がオンラインで繋がり、コミュニケーションを取り、自然な形で母語を使うことができるウェブサイトの良い例です。
Indigenous Tweetsは、少数言語の単語やフレーズを収録したデータバンクを用いて、それらの言語を話す人々を見つけています。2011年4月のBBCニュースのインタビューで、スキャネル氏はブログ、新聞、ウェブサイトを精査し、約500言語のデータバンクを構築するのに8年を費やしたと述べています。[ 3 ]
Indigenous Tweetsは、TwitterのAPIを通じて、少数言語の単語やフレーズのデータバンクを検索し、データを収集しています。[ 3 ]ウェブサイトの検索エンジンは、単語が複数の言語で使用されている場合、ツイートの言語を判別できません。この問題を回避するため、Scannellは各言語に固有の単語を入力します。[ 4 ]