Web上のテキストコーパスを利用したオノマトペ概念辞書の自動構築 Automatic construction of a Japanese onomatopoeia dictionary using text data on the WWW

この論文にアクセスする

この論文をさがす

著者

    • 奥村 敦史 OKUMURA Atsushi
    • 東京工業大学大学院 総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
    • 齋藤豪 SAITO Suguru
    • 東京工業大学 精密工学研究所 Precision and Intelligence Laboratory, Tokyo Institute of Technology
    • 奥村 学 OKUMURA Manabu
    • 東京工業大学 精密工学研究所 Precision and Intelligence Laboratory, Tokyo Institute of Technology

抄録

感性を表す言語であるオノマトペ(擬音語・擬態語)は新語・造語が多く,既存の辞書には語彙が不足している.また,既存の自然言語処理用コーパスにもオノマトペはあまり出現しない.そこで本研究では,自動生成したオノマトペ候補語をクエリとしてWeb上のテキストを検索し,候補語を含む用例を取得することでこれをコーパスとみなす.次に得られたコーパスを解析し,候補語がオノマトペかどうかの判定を行う.オノマトペと判断された語については,係り受け解析結果の頻度情報などを利用し,その語義や用法を得る.最後に,複数の候補語の語義を照らし合わせて,語義間の距離を定義したオノマトペ概念辞書を構築する.Onomatopoeias which express sensibility include many new words and coined words, and the existing dictionaries are insufficient of their vocabularies. Furthermore, onomatopoeias seldom appear in the existing corpus for natural language processing. In this work, we generate candidate words of onomatopoeias automatically and search the text on the Web with a search engine using the candidates as a query. Therefore we can acquire a corpus containing examples of the candidates. Then, we process the corpus and judge whether each candidate is onomatopoeia or not. If a candidate is judged to be an onomatopoeia, we give its sense and usage from results of syntactic analysis, and construct a concept dictionary of onomatopoeias.

Onomatopoeias which express sensibility include many new words and coined words, and the existing dictionaries are insufficient of their vocabulaires. Furthermore, onomatopoeias seldom appear in the existing corpus for natural language processing. In this work, we generate candidate words of onomatopoeias automatically and search the text on the Web with a search engine using the candidates as a query. Therefore we can acquire a corpus containing examples of the candidates. Then, we process the corpus and judge whether each candidate is onomatopoeia or not. If a candidate is judged to be an onomatopoeia, we give its sense and usage from results of syntactic analysis, and construct a concept dictionary of onomatopoeias.

収録刊行物

  • 情報処理学会研究報告自然言語処理(NL)  

    情報処理学会研究報告自然言語処理(NL) 2003(23(2002-NL-154)), 63-70, 2003-03-06 

    一般社団法人情報処理学会

参考文献:  8件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  5件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    110002911593
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    6547048
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  CJP引用  NDL  IPSJ 
ページトップへ