Clear Sky Science · ja
TamilSTARNet:三段階アーキテクチャと注意機構に基づく手書きタミル文字の分割と認識
古いタミルの筆記をデジタル時代へ
南インドやそれ以遠に広がる地域には、貴重な物語や詩、記録が薄れゆく紙や掌葉(パームリーフ)、ノートの中に眠っています。これらの多くが手書きで記されているため、コンピュータによる読み取りは困難であり、タミル文化の大部分が検索や共有、研究に適さないままになっています。本稿は TamilSTARNet を紹介します。これは手書きタミルの読み取りに特化して設計されたコンピュータビジョンシステムで、何世紀にもわたる遺産をデジタルで保存・アクセス可能にすることを目的としています。
キーワード: 手書きタミルOCR, 文書のデジタル化, 注意機構ベースのニューラルネットワーク, 文化遺産の保存, 文字体系認識