Nグラムと文字データベースによる漢字仏教文献の分析 Analysis of Chinese Buddhist Texts with N - gram Model and Character Knowledge Database

この論文にアクセスする

この論文をさがす

著者

抄録

近年、漢字仏教文献をNグラムモデルによって分析する方法が成果をあげつつある。しかしながらこの方法は、文字の同定などの本質的な部分において文字コードに依存しているのが課題であった。本稿では、筆者が開発に参加しているCHISEプロジェクトの文字データベースと文字処理システムを用いて、文字コードに依存しないNグラム処理の試みについて報告する。In recent years, statistical analysis of Chinese Buddhist classics using N-gram model is getting a result. However, it has not been solved that N-gram processing. such as identification of a character, is essentially dependent on a character code sets. In this paper, I would like to report a test implementation of N-gram processing independent of any character code sets, using the character database and character processing system of CHISE project which I have participated in development.

In recent years, statistical analysis of Chinese Buddhist classics using N-gram model is getting a result. However, it has not been solved that N-gram processing, such as identification of a character, is essentially dependent on a character code sets. In this paper, I would like to report a test implementation of N-gram processing independent of any character code sets, using the character database and character processing system of CHISE project which I have participated in development.

収録刊行物

  • 情報処理学会研究報告人文科学とコンピュータ(CH)

    情報処理学会研究報告人文科学とコンピュータ(CH) 2004(7(2003-CH-061)), 13-18, 2004-01-23

    一般社団法人情報処理学会

参考文献:  18件中 1-18件 を表示

各種コード

  • NII論文ID(NAID)
    110002911115
  • NII書誌ID(NCID)
    AN1010060X
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    6850875
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ