単語対応付けに基づく日本語学習者による作文の自動識別

Bibliographic Information

Other Title
  • タンゴ タイオウ ズケ ニ モトズク ニホンゴ ガクシュウシャ ニ ヨル サクブン ノ ジドウ シキベツ
  • Automatic Classification Using Word Alignment for Japanese Learners' Composition
  • 自然言語

Search this article

Abstract

本稿では,学習者による作文と母語話者による作文を訓練事例とした機械学習で構築した識別器を用いて学習者の作文を自動識別する手法について述べる.提案手法では,学習者と母語話者の作文の違いを表す特徴(素性)として,日本語作文とそれに対応する英文における単語どうしの対応に着目した.検証実験の結果,(1)92.7%の識別精度で学習者と母語話者の作文の識別が可能であることと,(2)学習者の作文を2段階で人手評価したとき,識別精度は下位群で有意に高く,上位群で有意に低いことが確認できた.これらの結果から,提案手法によって学習者の作文の評価を支援できることが示唆される.

This paper presents a method of automatically classifying sentences written by learners of Japanese as a second language. We use machine learning algorithms to construct classifiers that distinguish learners' sentences from native speakers' sentences. For this distinction, our method analyzes unnatural literal translation (word-for-word translation) in composition, and constructs a classifier based on features derived from word alignment, which presents the literal translation. In our experiment, we found that our method achieved a classification accuracy of 92.7%, and concluded that this method should assist the evaluation of Japanese learners' composition.

Journal

Related Projects

See more

Keywords

Details 詳細情報について

Report a problem

Back to top