日本語文書リーダ後処理の実現と評価

書誌事項

タイトル別名
  • Implementation and Evaluation of Post - Processing for Japanese Document Readers
  • 自然言語処理

この論文をさがす

抄録

日本語文書リーダは 世の中で流通している雑誌 書籍 公文書等の印刷文書を読み取り 計算機で使用されているコード情報に変換する装置である.文書リーダ後処理は 文書リーダ装置の文字認識部で認識した結果の候補文字集合列に対して 単語照合 文法検査などの言語処理を施し 正解文字列の推定を行う.推定方式としては (1)文字認識から得られる各候補文字に付けられた評価値 および (2)単語照合検査 単語間接続可能性検査や文字接続確率などの言語的制約によって計算される評価値 の2つに基づく方式を考案し実現した.その結果 後処理前認識率 すなわち文字認識のみの認識率が90%以上の場合 後処理を施すことにより 認識率をほぼ95%以上に高めることが可能になった.本論文では 後処理における諸問題とその解決策 本システムの処理方式と今後の課題について述べる.

収録刊行物

被引用文献 (21)*注記

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050845762819252352
  • NII論文ID
    110002724536
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00015133/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ