大規模地方議会会議録の分散表現を用いた地方議会のトピック分析

DOI

書誌事項

タイトル別名
  • Topic Analysis in Local Assemblies Using Word Embeddings Obtained from Large-scale Local Assembly Minutes

抄録

<p>本研究では,地方議会会議録に対して,地方議会でどのような話題が議論されているかについてテキストマイニング手法を利用した分析を行う.既存研究では話題の分析を行う際に,最も適切な単語単位はどの程度なのか,大規模な都道府県議会会議録から得られた単語の分散表現が利用可能なのかについて研究が行われていない.本稿では,NTCIR14 Segmentation task で利用されたデータセットを用いて,単語分割や学習データの違いにより,トピックモデルの結果がどの程度異なるのかについて分析を行った.その結果,単語分割については,Comainuを用いたことにより,固有名詞や複合名詞を扱えるようになり,トピックの意味が理解しやすくなり,ラベル付けが容易できることを確認した.学習コーパスについては, 地方議会会議録を学習データとした分散表現を用いることで,細かな表現に対応できるこ可能性があることを確認した.しかしながら,異なる分散表現を用いたときのトピックには明確な違いを確認することができなかった.</p>

収録刊行物

詳細情報

  • CRID
    1390285300166445184
  • NII論文ID
    130007857464
  • DOI
    10.11517/pjsai.jsai2020.0_4rin159
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ