特定トピックの日英ブログ収集・分析・類型化 : 事例研究  [in Japanese] Collecting/Analyzing/Categorizing Japanese and English Blogs with Specific Topics : A Case Study  [in Japanese]

Search this Article

Author(s)

Abstract

我々は,これまで,ブログ空間中に存在する有用な情報や知識に的確にアクセスし利用するという目的のもとで,体系化された知識体系である Wikipedia とブログサイトを対応づける研究を行ってきた.しかし,同一のトピックについて記述しているブログであっても,ブロガーの立場や環境は大いに異なることがわかった.そこで,本研究では,ブログ空間の情報や知識を類型化するための方式の一つとして,「ブロガーの立場」 に着目してブログサイト・ブログ記事を類型化するというアプローチをとる.具体的には,本稿では,特定トピックについてのブログに含まれる情報の有用性を検証するための事例研究として,「詐欺」,「インターネット犯罪」 の分野を対象として,日英ブログサイトおよびブログ記事の収集を行い,ブログでの記述内容を被害者・ニュース記事引用・防止対策に類型化した結果を報告する.日英各言語のブログサイト・ブログ記事の収集には,ある同一トピックについて詳しい記述をしているブログサイトを検索する手法と,検索エンジンによるブログ記事検索手法を組み合わせて用いた.そして,収集したブログサイト・ブログ記事にはどのようなタイプの立場があるかを分析し,それらを類型化した.Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for outsiders from abroad who are not familiar with cultures and crimes in foreign countries. This paper proposes a multilingual framework of categorizing people's concerns, reports, and experiences on crimes in their own blogs. First, we refer to Wikipedia as a multilingual terminological knowledge base, and search for Wikipedia entries describing criminal acts. In the retrieval of blog feeds/posts, we take two approaches, focusing on various types of bloggers such as experts in the crime domain and victims of criminal acts. We further categorize the retrieved blog feeds/posts into four types including experts in the crime domain and victims of criminal acts.

Journal

  • 情報処理学会研究報告. 自然言語処理研究会報告

    情報処理学会研究報告. 自然言語処理研究会報告 194, I1-I8, 2009-11-16

    情報処理学会

References:  11

Codes

  • NII Article ID (NAID)
    110008003254
  • NII NACSIS-CAT ID (NCID)
    AN10115061
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09196072
  • NDL Article ID
    024802284
  • NDL Call No.
    YH247-911
  • Data Source
    CJP  NDL  NII-ELS 
Page Top