自然言語処理のためのSVM高速化 Speeding Up Support Vector Machines for Natural Language Processing

この論文をさがす

著者

    • 磯崎 秀樹 ISOZAKI Hideki
    • 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, Nippon Telegraph and Telephone Corp.
    • 賀沢 秀人 KAZAWA Hideto
    • 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, Nippon Telegraph and Telephone Corp.

抄録

サポートベクトルマシン(SVM)は高性能な機械学習方法として注目されている。もともと文字認識などのパターン認識で利用されているが、最近は、自然言語処理にも応用されており、品詞タグ付け、チャンキング、固有表現抽出、専門用語抽出、係り受け解析、構文解析、重要文抽出など、様々なタスクで従来手法と同等か、従来手法をしのぐ性能が報告されている。しかし、従来手法に比べて桁違いに実行速度が遅いこともわかってきた。そこで我々は、自然言語処理のデータの特徴を利用して実行速度を大幅に改善できるアルゴリズムを考案した。ここでは、この方法について報告する。

The Support Vector Machine (SVM) is a new powerful learning algorithm. It has been used for Pattern Recognition such as character recognition. Now, it is also used in the Natural Language Processing (NLP) community, and SVM-based methods are proposed for various NLP tasks such as document classification, part-of-speech tagging, chunking, named entity recognition, term recognition, dependency analysis, and parsing. These SVM-based methods are comparable to or better than conventional methods. In some tasks, however, SVM-based systems run orders-of-magnitude slower than conventional methods. Here, we report an efficient algorithm that exploits characteristics of NLP data.

収録刊行物

  • 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 102(317), 17-22, 2002-09-12

    一般社団法人電子情報通信学会

参考文献:  17件中 1-17件 を表示

各種コード

  • NII論文ID(NAID)
    110003275575
  • NII書誌ID(NCID)
    AN10541106
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    6331362
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ