ニューラルネットワークによるインターネット配信ニュースの記事切り出し

書誌事項

タイトル別名
  • ニューラル ネットワーク ニ ヨル インターネット ハイシン ニュース ノ キジ キリダシ
  • Article Segmentation of Internet Delivery News Using Neural Network
  • テキスト処理

この論文をさがす

抄録

インターネットの普及により 日々大量のテキストデータをメール配信サービスにより入手できるようになった. 大量の情報を高速に処理するためには 深い意味解析に立ちいらず なるべく個々のデータ形式にとらわれない方法で記事を切り出すことが必要である. 本報告では ニューラルネットワーク技術を適用した記事切り出し方法を提案する. 7つの配信サービスに適用し その有効性を検証した. 平均で98.5%という高い認識率が得られた. さらに ルールで補正することにより 認識率を99.3%にまで高めることができた. また 学習パターンに冗長性があることに着目して 学習の進捗によって冗長パターンを検出し この学習をスキップすることにより 大幅な高速化(約5倍)を達成した.

With the spread of the Internet, large volumes of text-based data can be obtained via mail distribution services. Processing large volumes of information at high speeds requires an article segmentation method that does not perform in deep semantic analysis and is not limited to any particular data format. This paper proposes an article segmentation method that employs neural network technology. Its effectiveness was verified by applying it to seven distribution services. On average, a high recognition ratio of 98.5% was obtained. Furthermore, this recognition ratio may be improved to 99.3% through rule-based correction. Because the set of learning patterns contains redundancy, eliminating these redundant learning patterns resulted in a sharp increase in speed (approximately five fold).

収録刊行物

参考文献 (9)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ