表層的特徴とテキスト特徴に基づくオンラインディスカッションの健全度定量化手法

書誌事項

タイトル別名
  • ヒョウソウテキ トクチョウ ト テキスト トクチョウ ニ モトズク オンラインディスカッション ノ ケンゼンド テイリョウカ シュホウ
  • A Method for Quantifying Soundness of Online Discussion Using Surface and Textual Features

この論文をさがす

抄録

インターネットの普及により,一般ユーザでもオンラインでのディスカッションを容易に行えるようになった.このような状況下では,多数存在するディスカッションのそれぞれについて,どの程度円滑に進行しているのか数値化することがユーザ,およびディスカッションサイトの管理者双方にとって必要である.そこで本稿では,ディスカッションの円滑な進行に寄与すると人間が感じる発言のディスカッション全体に占める割合を健全度と定義し,ディスカッションのデータから単純集計により取得可能な参加人数や発言間の時間間隔等の表層的特徴量と,ディスカッションの内容を表す単語の重要度からなるテキスト特徴に基づいて,ディスカッションの健全度を定量化する手法を提案する.人手で付与した健全度に応じてディスカッションに健全,半分程度が荒れ,荒れの3つのラベルを設定し,提案手法によるラベル予測の精度を評価した結果,テキスト特徴のみに基づく分類手法よりもF値が上回ることを確認した.これにより,本稿で述べる提案手法は健全度が高いディスカッションをユーザに提示し,参加を促すといった利用シーンへの適用が期待できる.

The spread of online community sites such as social networking services has made it possible for common users to conduct discussions online. The rapid increase of such online discussions has aroused the demand of technologies to automatically present lively and exciting online discussions to the user, and also to detect “flamed” discussions to the service providers to prevent unnecessary collisions between users. This research proposes a novel method to quantify the soundness of online discussion based on simple surface and textual features extracted from online discussions. The features used by the proposed method needs neither a large-scale dictionary nor advanced text analysis. In addition, the features are generic, thus extractable from any type of online discussion. Our proposed method achieved higher F-measure for the classification of “sound” and “flamed” online discussions than typical text classification methods using term features, proving the effectiveness to select such discussions to system users.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ