ストローク単位の確率文脈自由文法を用いたオンライン手書き数式データベースの作成  [in Japanese] Making On-Line Handwritten Mathematical Expression Database Using Stroke-Based Stochastic Context-Free Grammar  [in Japanese]

Search this Article

Author(s)

    • 山本 遼 YAMAMOTO Ryo
    • 東京大学 大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
    • 酒向 慎司 SAKO Shinji
    • 東京大学 大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo

Abstract

本研究では、オンライン手書き数式認識手法の性能評価とモデルの学習を目的としたオンライン手書き数式データベースの作成を行った。100筆者による科学技術レベルの数式200種約1000データ、シンボル245種約20000データを収集した。さらにデータ内のストロークと数式内のシンボルの対応情報を自動的に推定する手法を検討し、我々の提案してきた確率文脈自由文法による数式認識手法を正解数式範囲内の文法制約下で利用することにより、半自動的なシンボルアラインメント推定を実現し、データベースのアラインメント付けの作業を大きく軽減することができた。

In this paper, we built an on-line handwritten mathematical expression database for evaluation and training of mathematical expression recognition systems. We collected 1000 handwriting data of 200 mathematical expressions taken from scientific papers, and 20000 handwriting data of 245 mathematical symbols. We also explored a method to automatically estimate the alignment between input strokes and symbols. We could reduce labor in tagging alignment by hand using our previously proposed method for expression recognition under the grammatical constraint of the correct expression.

Journal

  • IEICE technical report

    IEICE technical report 106(606), 13-17, 2007-03-09

    The Institute of Electronics, Information and Communication Engineers

References:  5

Codes

  • NII Article ID (NAID)
    110006248958
  • NII NACSIS-CAT ID (NCID)
    AN10541106
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    8707167
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top