洒落本コーパス構築の試行

DOI NINJAL Web Site オープンアクセス

書誌事項

タイトル別名
  • A Trial Construction of the Sharebon Corpus
  • シャレホン コーパス コウチク ノ シコウ

この論文をさがす

抄録

常葉大学

国立国語研究所 研究系 言語変化研究領域 非常勤研究員

Tokoha University

Adjunct Researcher, Language Change Division, Research Department, NINJAL

筆者らは,現在,国立国語研究所で開発が進められている『日本語歴史コーパス』の一部として,近世洒落本を対象とするコーパスを開発しており,その試作版を『ひまわり版「洒落本コーパス」Ver. 0.5』(2015年10月28日公開)として公開した。本コーパス構築にあたっては,他の『日本語歴史コーパス』所収のコーパス同様,文書構造に関する情報や形態論情報を付与するとともに,新たに所蔵版本への画像リンクや,詳細な話者情報を付与する試みを行った。これにより,近世資料の持つ地域差・位相差にも配慮した近世語コーパスのモデルを示すことができた。

This paper presents an overview, the features, and utility of the Sharebon Corpus. We attempted to construct a corpus of Early Modern Japanese text, which is a part of the Corpus of Historical Japanese (CHJ) built by The National Institute for Japanese Language and Linguistics. We released a trial version of the Sharebon Corpus on October 28, 2015. This corpus has not only annotated morphemes and document information, just as the other corpora of the CHJ, but also realized the following new functions. First, we implemented the reference function that displays images of original books printed from woodblocks. Second, we made detailed annotations of information about speakers. Early Modern Japanese texts are written in various styles because of the differences, such as region, social class, and generations among others. In this article, we will illustrate that this corpus, which provides voluminous information, will be effective for such texts.

application/pdf

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ