giin.dataforkashiwa.net を作った
議事録から議員の特徴を分析する
January 25, 2018
https://giin-dataforkashiwanet.now.sh で、「議事録から見る柏市議会議員」というコンテンツを公開しました。
やっていることは非常にシンプルです。 議事録に対して形態素解析(mecab)をかけ、非自立語などを除いた名詞だけを対象に出現頻度を計算し、ワードクラウドで可視化しています。 議員のことを知らないと特徴が出ているかは判断しにくいですが、ある議員の結果をその議員と面識がある人に見せたら特徴がうまく出ているとのことなので、 そんなにひどい結果ではなさそうです。
再頻出ワードのfont-sizeを固定しているので、発言回数が少なiいとワードごとの頻度に差が表れず、全体的に大きい文字で表示されてしまうのが難点です。 発言回数のレンジでmaxのfont-size調整をしていますが、全議員で表示のバランスがとれた状態にはなっていません。
発言回数と言っても、議事録上の一つの発言に含まれる文の数は議員ごとにばらついていそうな感覚があるので、 発言回数だけでなく文数やトータルの単語数なども追加していきたいです。
議事録データの蓄積は10年以上はあるので、議会全体の話題の変遷を可視化しても面白そうです。 (すでに議員の特徴ではなくなってしまいますが)
余談ですが、議事録の利用について悩んでいることをfacebookで投稿したら、リアル市議会議員の方からフィードバックもらえたのが衝撃でした。 これぞSNS。
=================================== 追記:公開URLを変更しました(2018/11/29)