表記と送り仮名の使用パターンを用いた日本語文章の著者判別  [in Japanese] Author identification of Japanese texts based on notations and syllabic writings usage patterns  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 真栄城 哲也 MAESHIRO Tetsuya
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba
    • 上保 秀夫 JOHO Hideo
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba
    • 中山 伸一 [他] NAKAYAMA Shin-ichi
    • 筑波大学 図書館情報メディア研究科|筑波大学 知的コミュニティ基盤研究センター School of Library and Information Science, University of Tsukuba|Research Center for Knowledge Communities, University of Tsukuba

Abstract

本研究は,日本語の文章における表記および送り仮名の個人差に基づく著者判別の手法を提案 する.これらの特徴は日本語の文章に特有である.著者判別を評価するための解析対象は,大学生が書いた文章と,小説である.提案手法を,既存の手法で判別能力が高いとされる読点の使い方および品詞3-gramと比較した.その結果,表記・送り仮名を用いた判別は,既存の最良の手法と同程度の判別能力を持つことが明らかになった.提案手法は,既存手法とは異なる観点から著者の文体的特徴を捉えることができる.

This paper presents a novel feature to discriminate authors from Japanese texts, based on notations and syllabic writings usage patterns. These two properties are particular to Japanese texts. The proposed indicator's performance was compared to part-of-speech 3-gram and comma usage patterns, both considered as best methods for author identification tasks. Texts written by college students and published novels were analyzed. The proposed indicator provides a novel viewpoint to capture authors' characteristics, and its precision is equivalent to conventional best indicators.

Journal

  • Joho Chishiki Gakkaishi

    Joho Chishiki Gakkaishi 24(3), 342-364, 2014

    Japan Society of Information and Knowledge

Codes

  • NII Article ID (NAID)
    130004843610
  • NII NACSIS-CAT ID (NCID)
    AN10459774
  • Text Lang
    JPN
  • ISSN
    0917-1436
  • NDL Article ID
    025870952
  • NDL Call No.
    Z14-1782
  • Data Source
    NDL  J-STAGE 
Page Top