ストローク単位の確率文脈自由文法を用いたオンライン手書き数式認識  [in Japanese] Stroke-Based Stochastic Context-Free Grammar for On-line Handwritten Mathematical Expression Recognition  [in Japanese]

Search this Article

Author(s)

    • 山本 遼 YAMAMOTO Ryo
    • 東京大学 大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
    • 酒向 慎司 SAKO Shinji
    • 東京大学 大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo

Abstract

本論文ではオンライン手書き数式認識のための新しい手法を提案する.我々は,手書き数式を,ストローク列を生成する確率文脈自由文法としてモデル化し,数式の文法構造と2次元構造,シンボル内の構造を全て1つの文法で統一的に記述する手法を提案する.この手法によりシンボル認識・構造認識・数式文法解析といった独立の認識ステップを経ずに,これらの情報を同時に利用して数式認識を行うことができ,頑健な数式認識が期待できる.また数式の2次元構造モデルとして,さまざまな形状の非終端記号を統一的に扱うために,隠れ筆記領域という概念を提案し,これを用いて「シンボル形状に依存しない位置」をモデル化する.このモデルはデータからのパラメタ学習が可能であるため,十分な学習データが存在すれば頑健なモデルとなる期待がある.同一筆者が入力した,学術論文における中程度複雑さの8種80数式による評価実験の結果,数式のシンボル・構造の同時推定によってシンボル分割・認識精度が向上することが確かめられた.隠れ筆記領域は学習データが非常に限定されていた中で,シンボルのベースライン正解率約95%が得られた.

In this paper, we propose a new framework for on-line handwriting mathematical expression recognition. In this approach, we see handwriting mathematical expression as a stroke generation process with grammar. We do not solve 3 major problem in mathematical expression recognition one by one: symbol segmentation/recognition, 2-D structure analysis, and math syntax analysis, rather we estimate the most likely expression candidate derived from one stroke-based stochastic context-free grammar. Experiments of on-line handwriting mathematical expression recognition with 8 math expressions extracted from IEEE transactions, each of them written 10 times by one writer revealed that symbol segmentation error rate and symbol recognition error rate decline with simultaneous estimation of symbol, 2-D structure, and syntax of mathematical expressions.

Journal

  • IEICE technical report

    IEICE technical report 105(615), 111-116, 2006-02-24

    The Institute of Electronics, Information and Communication Engineers

References:  6

Codes

  • NII Article ID (NAID)
    110004662986
  • NII NACSIS-CAT ID (NCID)
    AN10541106
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    7849799
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top