大規模地方議会会議録の分散表現を用いた地方議会のトピック分析
書誌事項
- タイトル別名
-
- Topic Analysis in Local Assemblies Using Word Embeddings Obtained from Large-scale Local Assembly Minutes
抄録
<p>本研究では,地方議会会議録に対して,地方議会でどのような話題が議論されているかについてテキストマイニング手法を利用した分析を行う.既存研究では話題の分析を行う際に,最も適切な単語単位はどの程度なのか,大規模な都道府県議会会議録から得られた単語の分散表現が利用可能なのかについて研究が行われていない.本稿では,NTCIR14 Segmentation task で利用されたデータセットを用いて,単語分割や学習データの違いにより,トピックモデルの結果がどの程度異なるのかについて分析を行った.その結果,単語分割については,Comainuを用いたことにより,固有名詞や複合名詞を扱えるようになり,トピックの意味が理解しやすくなり,ラベル付けが容易できることを確認した.学習コーパスについては, 地方議会会議録を学習データとした分散表現を用いることで,細かな表現に対応できるこ可能性があることを確認した.しかしながら,異なる分散表現を用いたときのトピックには明確な違いを確認することができなかった.</p>
収録刊行物
-
- 人工知能学会全国大会論文集
-
人工知能学会全国大会論文集 JSAI2020 (0), 4Rin159-4Rin159, 2020
一般社団法人 人工知能学会
- Tweet
詳細情報
-
- CRID
- 1390285300166445184
-
- NII論文ID
- 130007857464
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可