On Statistical Models of Sentence Lengths

DOI HANDLE Open Access

Bibliographic Information

Other Title
  • 文の長さの統計モデル
  • ブン ノ ナガサ ノ トウケイ モデル

Search this article

Abstract

文の長さの統計モデルには、従来、単一の確率分布が想定され、対数正規分布やガンマ分布などのあてはめが試みられてきた。しかし、同じ確率分布モデルでも、文長において単文は有限、複文・重文は原理的に無限と仮定すれば、前者は左右対称に近い分布形、後者は右に裾を引く正に歪んだ分布形というように2つの分布型に分離できる。さらに、すべての文にはその従属節の数に応じた文長の限界がある(単文は従属節数0の文)と仮定すれば、従属節数を説明変数、文長を被説明変数とする単回帰モデル、あるいは、従属節の種類別に説明変数を設ける(被説明変数は同じく文長)重回帰モデルが成り立つ。ただし、回帰モデルの場合は、説明変数に文構造以外の要因を組み込む可能性があり、そのためには文長を決定する言語学的な機構の検討が必要となる。

Journal

  • 現代日本語研究

    現代日本語研究 9 109-123, 2017-03

    大阪大学大学院文学研究科 日本語学講座 現代日本語学研究室

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top