Web中の文章とリスト構造体を用いたバンドメンバー自動収集手法に関する研究

書誌事項

タイトル別名
  • Extraction of Band Members from Sentence and List Structure on the Web

この論文をさがす

抄録

本論文ではWeb中にある文章とリスト構造体から音楽のバンドやグループに関連するメンバーを自動的に収集する手法を述べる.音楽のバンドやグループには,ボーカルやギタリスト,ベーシストなど,多くのミュージシャンがメンバーとして参加している.これらの情報を収集する手段として,従来提案されていた手法では特定のパターンとWebテキストとのパターンマッチングによりバンドのメンバーを抽出していた.しかし特定のパターンを用いた抽出では汎用性に乏しく精度が不十分であった.本研究では N-gram モデルを用いたメンバー抽出と Web 上に存在する 「メンバーリスト」 を利用した手法を提案し,精度の向上を目指す.我々はまず,Web 上でメンバー情報が主に記載されている文章とリスト構造体を取得する.次に,N-gram モデルを用いて文章からメンバー抽出をおこなう.さらにその結果を用いてメンバーリストを判定し,リスト中のメンバーを抽出する.文章からの抽出とリストからの抽出で生じる誤情報のパターンには違いがあるため,それらの共通データのみを利用することで,正しいメンバーだけを収集することができる.我々は提案手法を用いてメンバー収集の正確性と汎用性を評価した.その結果提案手法は従来手法より精度の高い収集が可能であることを示した.In this paper, we propose a method of automatic collecting members that belongs to music band or group. Music band or group contains various kinds of members, vocalist, guitarist and bassist. As a means to gather this information, conventional method has been extracted the band members by the pattern matching between specific patterns and Web texts. But conventional method was poor in versatility and accuracy. We propose the method of extraction band members using N-gram model and member list on web, to improve the accuracy. First, we obtain sentences and list structure from web texts. Next, we extract band members from sentences using the N-gram model. Determining the member lists using the result, we extracted the members in the lists. We can extract the correct members by using the intersection of the data obtained from sentences and lists, because their incorrect information is difference each other. We evaluated the accuracy and versatility of the collection member by using the proposed method. As a result, he proposed method was able to collect accurate than the conventional methods.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1573668927687682048
  • NII論文ID
    110009551870
  • NII書誌ID
    AA12049625
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ