コード比率

Codice Ratioは、光学文字認識人工知能などの新しい技術を研究し、バチカン使徒文書館の文書をデジタル化する研究プロジェクトです。[ 1 ] [ 2 ]文書のほとんどは手書きです。[ 3 ] [ 4 ]

歴史

2017年、ローマ・トレ大学を拠点とするプロジェクト「In Codice Ratio」が、人工知能と光学式文字認識を用いて、アーカイブからより多くの文書を転写する試みを開始しました。[ 3 ] [ 5 ]文字認識ソフトウェアは入力されたテキストの読み取りには優れていますが、中世の手書き文字は狭くセリフが多いため、ソフトウェアが個々の文字を区別することは困難です。[ 6 ]アルファベットの個々の文字の多くは、コンピュータープログラムはもちろん、中世の手書き文字を読む人間でさえも混同することがよくあります。In Codice Ratioのチームは、この手書き文字を解析できる機械学習ソフトウェアを開発することで、この問題を解決しようとしました。最終的に、このプログラムはこの種のテキストの解析で96%の精度を達成しました。[ 7 ]

参考文献

  1. ^ Firmani, Donatella; Maiorino, Marco; Merialdo, Paolo; Nieddu, Elena (2018-03-01). 「バチカン秘密文書館からの知識発見に向けて。Codice Ratio - エピソード1」.第24回ACM SIGKDD国際知識発見・データマイニング会議議事録. pp.  263– 272. arXiv : 1803.03200 . doi : 10.1145/3219819.3219879 . ISBN 9781450355520. S2CID  3772349 .
  2. ^ 「バチカン秘密文書館からの知識発見に向けて。Codice Ratio誌」 SIGKDD - KDD 2018。2021年3月25日閲覧
  3. ^ a b Kean, Sam (2018年4月30日). 「人工知能がバチカンの秘密文書庫を暴く」 .アトランティック誌. 2021年3月25日閲覧
  4. ^ Firmani, Donatella; Merialdo, Paolo; Nieddu, Elena; Scardapane, Simone (2017年12月). 「In Codice Ratio: 深層畳み込みネットワークを用いた手書きラテン語文書のOCR」 .
  5. ^ Firmani, D.; Merialdo, P.; Nieddu, E.; Scardapane, S. (2017). 「In Codice ratio: OCR of handwritten Latin documents using deep convolutional networks」(PDF) . 文化遺産のための人工知能に関する国際ワークショップ. pp.  9– 16.
  6. ^ 「AIがバチカンの秘密に挑む」 MITテクノロジーレビュー、2018年3月15日。 2018年11月27日閲覧
  7. ^フィルマーニ、ドナテッラ;メリルド、パオロ。マルコ・マイオリーノ(2017年9月25日)。「法典比率: バチカン登録簿のスケーラブルな転記」ERCIM ニュース2018 年11 月 27 日に取得