活字データの分類を用いた進化計算による近代書籍からのルビ除去

書誌事項

タイトル別名
  • Ruby Removal Filters by Genetic Programming using the classification of printing type data for Early-Modern Japanese Printed Books

この論文をさがす

抄録

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして Web 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがヒストグラムでは除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,提案した手法は書籍に付加された外部情報を元にしており,実現可能性は低い.そこで本論文では,書籍画像から直接得られるデータを元に,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1570572702972833024
  • NII論文ID
    110009795498
  • NII書誌ID
    AN10505667
  • ISSN
    09196072
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ