Nグラムと文字データベースによる漢字仏教文献の分析 Analysis of Chinese Buddhist Texts with N-gram Model and Character Knowledge Database

抄録

近年、漢字仏教文献をNグラムモデルによって分析する方法が成果をあげつつある。しかしながらこの方法は、文字の同定などの本質的な部分において文字コードに依存しているのが課題であった。本稿では、筆者が開発に参加しているCHISEプロジェクトの文字データベースと文字処理システムを用いて、文字コードに依存しないNグラム処理の試みについて報告する。

In recent years, statistical analysis of Chinese Buddhist classics using N-gram model is getting a result. However, it has not been solved that N-gram processing, such as identification of a character, is essentially dependent on a character code sets. In this paper, I would like to report a test implementation of N-gram processing independent of any character code sets, using the character database and character processing system of CHISE project which I have participated in development.

収録刊行物

情報処理学会研究報告. 人文科学とコンピュータ研究会報告   [巻号一覧]

情報処理学会研究報告. 人文科学とコンピュータ研究会報告 2004(7), 13-18, 2004-01-23  [この号の目次]

一般社団法人情報処理学会

参考文献:  18件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110002911115
  • NII書誌ID(NCID) :
    AN1010060X
  • 本文言語コード :
    JPN
  • 資料種別 :
    ART
  • ISSN :
    09196072
  • NDL 記事登録ID :
    6850875
  • NDL 雑誌分類 :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号 :
    Z14-1121
  • 収録DB :
    CJP書誌  NDL  NII-ELS 

書き出し