A Trial Construction of the Sharebon Corpus

DOI NINJAL Web Site Open Access

Bibliographic Information

Other Title
  • 洒落本コーパス構築の試行
  • シャレホン コーパス コウチク ノ シコウ

Search this article

Abstract

常葉大学

国立国語研究所 研究系 言語変化研究領域 非常勤研究員

Tokoha University

Adjunct Researcher, Language Change Division, Research Department, NINJAL

筆者らは,現在,国立国語研究所で開発が進められている『日本語歴史コーパス』の一部として,近世洒落本を対象とするコーパスを開発しており,その試作版を『ひまわり版「洒落本コーパス」Ver. 0.5』(2015年10月28日公開)として公開した。本コーパス構築にあたっては,他の『日本語歴史コーパス』所収のコーパス同様,文書構造に関する情報や形態論情報を付与するとともに,新たに所蔵版本への画像リンクや,詳細な話者情報を付与する試みを行った。これにより,近世資料の持つ地域差・位相差にも配慮した近世語コーパスのモデルを示すことができた。

This paper presents an overview, the features, and utility of the Sharebon Corpus. We attempted to construct a corpus of Early Modern Japanese text, which is a part of the Corpus of Historical Japanese (CHJ) built by The National Institute for Japanese Language and Linguistics. We released a trial version of the Sharebon Corpus on October 28, 2015. This corpus has not only annotated morphemes and document information, just as the other corpora of the CHJ, but also realized the following new functions. First, we implemented the reference function that displays images of original books printed from woodblocks. Second, we made detailed annotations of information about speakers. Early Modern Japanese texts are written in various styles because of the differences, such as region, social class, and generations among others. In this article, we will illustrate that this corpus, which provides voluminous information, will be effective for such texts.

application/pdf

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top