文書認識における言語情報の活用(1) : 概要

書誌事項

タイトル別名
  • Application of linguistic information in document recognition

この論文をさがす

抄録

既存印刷文書を電子ファイリングして活用するために,OCRは有力な手段である.しかし日本語文書を対象とする場合,日本語は文字種が多いことなどから認識誤りを完全に無くすことは困難である.文字認識結果中の候補文字列から最適な単語のパスを探索することによる誤り訂正・指摘方式を開発したので,その概要について述べる.また,文字認識における切り出し誤りへの対応も考慮した拡張形態素解析について論じる.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ