表記と送り仮名の使用パターンを用いた日本語文章の著者判別 Author identification of Japanese texts based on notations and syllabic writings usage patterns

この論文にアクセスする

この論文をさがす

著者

    • 真栄城 哲也 MAESHIRO Tetsuya
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba
    • 上保 秀夫 JOHO Hideo
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba
    • 中山 伸一 [他] NAKAYAMA Shin-ichi
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba

抄録

本研究は,日本語の文章における表記および送り仮名の個人差に基づく著者判別の手法を提案 する.これらの特徴は日本語の文章に特有である.著者判別を評価するための解析対象は,大学生が書いた文章と,小説である.提案手法を,既存の手法で判別能力が高いとされる読点の使い方および品詞3-gramと比較した.その結果,表記・送り仮名を用いた判別は,既存の最良の手法と同程度の判別能力を持つことが明らかになった.提案手法は,既存手法とは異なる観点から著者の文体的特徴を捉えることができる.

This paper presents a novel feature to discriminate authors from Japanese texts, based on notations and syllabic writings usage patterns. These two properties are particular to Japanese texts. The proposed indicator's performance was compared to part-of-speech 3-gram and comma usage patterns, both considered as best methods for author identification tasks. Texts written by college students and published novels were analyzed. The proposed indicator provides a novel viewpoint to capture authors' characteristics, and its precision is equivalent to conventional best indicators.

収録刊行物

  • 情報知識学会誌

    情報知識学会誌 24(3), 342-364, 2014

    情報知識学会

キーワード

各種コード

  • NII論文ID(NAID)
    130004843610
  • NII書誌ID(NCID)
    AN10459774
  • 本文言語コード
    JPN
  • ISSN
    0917-1436
  • NDL 記事登録ID
    025870952
  • NDL 請求記号
    Z14-1782
  • データ提供元
    NDL  J-STAGE 
ページトップへ