「決定木」分析によるコーパス研究の可能性 : 副詞と共起する接続助詞「から」「ので」「のに」の文中・文末表現を例に Possibility of 'Decision Tree' Analysis on Collocation Frequencies : In the Case of Conjunctive Particles kara, node and noni Co-occurring with Adverbs at the Middle and End of Sentences

この論文にアクセスする

この論文をさがす

著者

抄録

SPSS社のAnswerTree3.0Jに搭載されたCHAIDで決定木を描く統計手法が、コーパスから得られる2つ以上の変数からなる共起頻度を分析するのに有効であるかどうかを検討した。本研究では、3種類の接続助詞「から」「ので」「のに」が、7種類の副詞「何しろ」「何せ」「せっかく」「現に」「どうせ」「実際」「本当に」と共起する場合に、文中と文末の表現でどちらが使われるかを、新潮文庫の100冊を使って解析した。決定木(図1を参照)は、3種類の接続助詞と7種類の副詞の共起頻度によって、接続助詞の位置が文中にくるか文末にくるかを予測するという分析結果を描いたものである。決定木から5つの特徴を読み取ることができる。まず第1に、接続助詞「ので」と「から」が副詞との共起頻度において文中・文末で顕著な違いを示した。「ので」は文末ではほとんどみられず(5回あるいは4.59%)、「から」は頻繁にみられた(220回あるいは31.56%)。第2に、副詞「何しろ」と接続助詞「から」がもっとも典型的な文末表現であることが分かった(この種の組み合わせの合計324回のうち140回あるいは43.21%)。第3に、接続助詞「から」と副詞の「せっかく」の共起は、かなりあるものの、文末では非常に少ないことも分かった(この種の組み合わせの合計67回のうち6回あるいは8.96%)。第4に、接続助詞「から」と副詞「何せ」「現に」「どうせ」「実際」「本当に」はいずれも、文中・文末にほぼ同じようなパターンで共起していることも示された。第5に、接続助詞「のに」は副詞の文中・文末の共起パターン(文中が78.82%、文末が21.18%)が、全体の共起頻度(文中が72.73%、文末が27.27%)と類似していた。以上のように、AnswerTree3.0Jによる決定木の手法は、複数の変数からなる共起頻度データを構造的に分析することができ、今後のコーパス研究において有効な手段の一つとなるであろう。Using 'decision tree' drawn by a statistical algorism CHAID in SPSS AnswerTree3.0J, the present study investigated the collocation frequencies of three conjunctive particles(kara, node and noni) appearing in the middle of at the end of sentences, with seven selected adverbs(nanishiro, nanise, sekkaku, gen'ni, doose, jissai, and hontooni). Collocation frequencies were taken from the corpus of the Shinchoo Bunko Collection of 100 Novels. Analysis results depicted in the decision tree predict two different particle positions(middle and end) of three conjunctive particles appearing with the seven adverbs. Five noteworthy collocation tendencies were observed. First, the conjunctive particles node and kara showed distinctive differences in the middle and ending positions when appearing with the adverbs: node was seldom seen at the end of sentences(5 times, or 4.59%), while kara was often seen at the end (220times, or 31.56%). Second, the combination of the adverb nanishiro and the conjunctive particle kara occurred most frequently at the end of sentences(140 out of 324 times, or 43.21%). Third, although kara occasionally appeared with the adverb sekkaku, this combination was seldom observed at the end of sentences(6 out of 67 times, or 8.96%). fourth, the conjunctive particle kara showed a similar pattern of collocation frequencies in the middle and at the end of sentences when combined with the five adverbs nanise, gen'ni, doose, jissai and hontooni.Fifth, the conjunctive particle noni appeared in the middle and at the end of sentences(78.82 0n the middle and 21.18-0x1.47b00bfff994p-149t the end), similar to the overall percentages of the conjunctive particles(72.73-1073777684n the middle and 27.27 0x0.006c8000006c9p-1022t the end). As such, in structurally depicting the collocation frequencies of conjunctive particles and adverbs, 'decision tree' analysis has considerable potential as a statistical approachi in duture collocation studies.

収録刊行物

  • 自然言語処理 = Journal of natural language processing  

    自然言語処理 = Journal of natural language processing 13(2), 169-179, 2006-04-10 

    言語処理学会

参考文献:  13件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10018136909
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    NOT
  • ISSN
    13407619
  • NDL 記事登録ID
    7880356
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  NDL  IR 
ページトップへ