検索結果 10件中 1-10 を表示

  • 文書テンプレート再現のためのPDF文書構造化 (パターン認識・メディア理解)

    藤尾 正和 , 丸川 勝美 , 新庄 広 [他] , 永崎 健 , 関 峰伸

    我々は,文書の構造を理解し,メタ情報を自動的に付与することで,分類,整理,アクセス効率向上を目指した技術開発を進めている.本発表では,メタ情報付与技術の応用例の一つとして,PDF文書中の罫線オブジェクト,テキストオブジェクトの種別に基づき、文書中の固定領域(プレ印刷),変数領域(データ部分)を抽出し,文書のテンプレートを再現する技術について紹介する。

    電子情報通信学会技術研究報告 108(94), 71-76, 2008-06-19

  • 文書テンプレート再現のためのPDF文書構造化 (データ工学)

    藤尾 正和 , 丸川 勝美 , 新庄 広 [他] , 永崎 健 , 関 峰伸

    我々は,文書の構造を理解し,メタ情報を自動的に付与することで,分類,整理,アクセス効率向上を目指した技術開発を進めている.本発表では,メタ情報付与技術の応用例の一つとして,PDF文書中の罫線オブジェクト,テキストオブジェクトの種別に基づき、文書中の固定領域(プレ印刷),変数領域(データ部分)を抽出し,文書のテンプレートを再現する技術について紹介する。

    電子情報通信学会技術研究報告 108(93), 71-76, 2008-06-19

    被引用文献1件

  • 文書テンプレート再現のためのPDF文書構造化

    藤尾 正和 , 丸川 勝美 , 新庄 広 , 永崎 健 , 関 峰伸

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 108(94), 71-76, 2008-06-12

    参考文献8件

  • 文書テンプレート再現のためのPDF文書構造化

    藤尾 正和 , 丸川 勝美 , 新庄 広 , 永崎 健 , 関 峰伸

    電子情報通信学会技術研究報告. DE, データ工学 108(93), 71-76, 2008-06-12

    参考文献8件

  • 表構造における意味的関係に基づくWWW検索性能の向上

    松本 章代 , 小西 達裕 , 高木 朗 [他] , 小山 照夫 , 三宅 芳雄 , 伊東 幸宏

    ウェブ検索エンジンに,ユーザが検索キーワードとして二つの語を入力した場合に,その2語が意味的関係をもって文書中に出現しているか否かを判定することにより,ウェブ検索エンジンの性能を向上させる手法を提案する.キーワード間の意味的関係を表現する構造として,本研究では表構造を取り上げる.提案手法を評価するために,既存の検索エンジンのフィルタリングツールを構築し,自作の評価用データセットを用いて実験を行った …

    電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 91(3), 560-575, 2008-03-01

    機関リポジトリ 参考文献16件 被引用文献2件

  • XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析

    石谷 康人 , 布目 光生 , 住田 一男

    本論文では, 紙媒体の表をXMLスキーマやDTDに基づいたXML文書に変換する新しい方法を提案する.本方式ではまず, 文書画像に変換した表から罫線で区切られたデータフィールドをセル特徴として抽出する.次に, 各セル特徴をあらかじめ定めた5つのタイプに分類することによりセル配置が不規則な表を識別すると共に, 特定のセルに対して変形処理を実施することにより規則正しいセル配置を形成する.さらに, 規則正 …

    電子情報通信学会技術研究報告 104(740), 157-162, 2005-03-18

  • XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析

    石谷 康人 , 布目 光生 , 住田 一男

    本論文では, 紙媒体の表をXMLスキーマやDTDに基づいたXML文書に変換する新しい方法を提案する.本方式ではまず, 文書画像に変換した表から罫線で区切られたデータフィールドをセル特徴として抽出する.次に, 各セル特徴をあらかじめ定めた5つのタイプに分類することによりセル配置が不規則な表を識別すると共に, 特定のセルに対して変形処理を実施することにより規則正しいセル配置を形成する.さらに, 規則正 …

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 104(742), 157-162, 2005-03-11

    参考文献8件

  • XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析

    石谷 康人 , 布目 光生 , 住田 一男

    電子情報通信学会技術研究報告. TL, 思考と言語 104(740), 157-162, 2005-03-11

    参考文献8件

  • HTML形式の表構造に対する一索引化手法

    獅々堀正幹 , 岩口 義広 , 鄭珉洙 [他] , 青江 順一

    WWW空間上のHTML文書には,形式的な情報を容易に伝達するために,数多くの表が含まれており,行列方向の単語間の関係や単語の意味情報など,非常に有益な情報を含んでいる.本研究では,これら表構造から固有名詞が有する意味的多義性に関する情報を抽出することを目的としており,その第一段階として,本稿ではHTML形式の表構造内の関係を保持したまま各項目を効率的に索引化する手法を提案する.本手法は,複雑な表に …

    情報処理学会研究報告データベースシステム(DBS) 2001(70(2001-DBS-125)), 305-312, 2001-07-17

    情報処理学会 参考文献8件 被引用文献1件

  • HTML形式の表構造に対する一索引化手法

    獅々堀 正幹 , 岩口 義広 , 鄭 〓洙 [他] , 青江 順一

    WWW空間上のHTML文書には, 形式的な情報を容易に伝達するために, 数多くの表が含まれており, 行列方向の単語間の関係や単語の意味情報など, 非常に有益な情報を含んでいる.本研究では, これら表構造から固有名詞が有する意味的多義性に関する情報を抽出することを目的としており, その第一段階として, 本稿ではHTML形式の表構造内の関係を保持したまま各項目を効率的に索引化する手法を提案する.本手法 …

    電子情報通信学会技術研究報告. DE, データ工学 101(192), 137-144, 2001-07-11

    参考文献8件 被引用文献1件

ページトップへ