文字クラスモデルに基づく日本語単語分割

書誌事項

タイトル別名
  • Japanese Word Segmentation Based on a Character Class Model

この論文をさがす

抄録

日本語処理において, 単語の同定, すなわち文の単語分割は, 最も基本的かつ重要な処理である。本稿では, 文字クラスモデルを言語モデルとして用いる新しい単語分割手法を提案する。まず, 本研究の基本である文字モデルに基づく単語分割法を示す。その上で, 文字モデルに代わり, 日本語文字のクラス分類により得られた文字クラスモデルに基づく単語分割モデルを提案する。文字クラスモデルでは, 推定すべきパラメータ数が文字モデルより少ないという大きな利点があり, 文字モデルより頑健な推定を可能とする。ATR対話データベースを用いた評価実験において, 文字モデルを用いた場合と文字クラスモデルを用いた場合の単語分割精度の比較を行い, 文字クラスモデルに基づく本手法の有効性を示す。

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (8)*注記

もっと見る

詳細情報

  • CRID
    1570572702247103360
  • NII論文ID
    110002935083
  • NII書誌ID
    AN10115061
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ