文字構造情報に基づく高精度な文字切出し処理を用いた文書認識システム

書誌事項

タイトル別名
  • Document Recognition System Using High Accuracy Segmentation Algorithm Based on Information of Character Structure
  • パターン認識

この論文をさがす

抄録

文書認識システムにおいて 文字切出しの精度の向上は大変重要な課題である現状では 個別文字の認識精度に比べ 切出しの精度が幾分低いため 文書認識システム全体の性能は切出しによって大きく左右されることになる切出しの精度に影響する要因は多数存在するが 新聞や文庫本のような文字中心のものに限って言えば 可変ピッチ文字列における分離文字や半角文字(縦書きの場合 半ピッチ文字)の存在が大きな要因であるすなわち 分離文字同士 あるいは分離文字と半角文字が二つ以上続いた場合に その切出しが困難になる本論文では そのような場合の問題の解決策として 文字構造情報を用いた統合方法を提案するこの方法で 高速かつ正確な切出しが可能であることを示す新聞社説(20部 約45 000文字)を対象に本手法を適用した認識実験を行い 文書中に分離文字や半角文字が連続して二つ以上続いた場合でも 9912%の統合率が確保でき また 文書画像の入力から認識結果の出力までのシステム全体として990%以上の認識率が得られることを示す

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (20)*注記

もっと見る

キーワード

詳細情報

  • CRID
    1050282812864617088
  • NII論文ID
    110002723388
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00014635/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ