単語格子とマルコフモデルによる日本語機能表現の解析 : 日本語機能表現辞書「つつじ」を用いて  [in Japanese]

Search this Article

Author(s)

Abstract

日本語機能表現辞書「つつじ」を用いて、日本語機能表現解析器を作成した。実装方法は、形態素解析済み文字列を形態素リストと見なし、「つつじ」のエントリーを参照し、機能表現の可能性のある部分に辺を張ることにより、単語格子構造を作成する。そして、単語格子から最適経路を決定することにより、日本語機能表現の曖昧性を解消する。最適経路の決定には、マルコフモデルを用い、その学習にはコーパスを用いる。同手法を、放送局に寄せられる意見(研究利用許諾済み擬似コーパス)に対して適用し、従来手法であるSVMを用いた機能表現解析器と同程度の87.51(%)という精度が得られた。

We have made a Japanese functional expression analizer using Japanese functional expression dictionary "Tsutsuji." The implementation is, morphologically analyzed text is first regarded as a list of morphemes, and then, by looking up the entry of "Tsutsuji," the candidate of functional expressions are span as edge to form a word lattice structure. By choosing the best path from the lattice, the disambiguations of the Japanese functiona expressions are achieved. To decide an optimal path from the lattice, Markov model is used, and the Markov model is trained from corpus. We applied the method to the corpus of opinions to the broadcasting company, and obtained 87.51(%) accuracy, which is comparable level to conventional method that uses SVM.

Journal

  • IEICE technical report

    IEICE technical report 109(142), 15-20, 2009-07-15

    The Institute of Electronics, Information and Communication Engineers

References:  7

Codes

  • NII Article ID (NAID)
    110007360371
  • NII NACSIS-CAT ID (NCID)
    AN10091225
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    10308032
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top