※注、思いつきで始めたことなので、有益な結果が得られるかどうかはまだ分かりません。ただただ思考プロセスだけを並べていって、「結局そんなに面白いことはありませんでした」となる可能性も十二分にあることを了承したうえで読み進めていってください。
僕の好きなアニメの一つに、PSYCHO-PASSってアニメがあるんですが、その第3期がPSYCHO-PASS3って名前でこの前(2019年10月から12月にかけて)放送されていました。
そのPSYCHO-PASS3はAmazonのプライムビデオでも見られるようになっていまして、Amazonで売られている他の商品と同じく、作品に対する感想欄(Amazonレビュー)が設けられています。
そのレビュー欄を見てるとPSYCHO-PASS3は低評価の数が結構あったので、なぜそんなに不評だったのか?をテキストマイニングツールを使って分析してみたくなったんです(KH Coderを使ってみるついでに)。
というわけで、レビュー欄に書かれているコメントをテキストマイニングツールを使って、PSYCHO-PASS3という作品をおすすめできない人はどんな人なのかをエビデンスベースドに考察してみました。
Dataminerと名乗っているので、たまにはこんな記事も良いかと思いまして。
目的
もうすでに書いていますが、一応テキストマイニングの目的(どんな結果が得たいのかとか、どんな行動に繋げたいのかとか)をまとめときます。
テキストマイニングに限らず、統計分析の場合は目的が明確になっていなかったり、曖昧性を孕んでいたりすると、最終的に得たい結果(例えば、視聴回数を増やすとか新規視聴者を獲得するとか)につながらない考察とか結論付けとかをしちゃうことがあるんですな。
なので、今回の分析の目標を決めておきます。今回の最終目標は「PSYCHO-PASS3がどんな人におすすめできるのかを考察すること」です。今回は特に、「なぜAmazonレビュー内では不評だったのか」という点に着目して考察していきます。
良い作品だと思えるかどうかはさておいて、悪いと評価された要素が分かっていれば、とりあえず地雷は避けられるんじゃないかなってことで、好評の原因ではなく、不評の原因を基にお勧めするという方針を取りました。
なので、最終的に言うこととしては、
- PSYCHO-PASS3に対する感想から、視聴者が不満に思ったポイントをテキストマイニングで見つけ出す
- 1で見つけ出したポイントから、それを許容できる(希望する)人に対してお勧めする
っていう2点になります。
もちろん、分析を進めていく中で、より有益な結果が得られそうな着眼点が見つかって目標を修正するということはあるかもしれませんし、より詳しく目標を設定し直す必要が出てくる可能性もあります。
ただし、目標をどう変えようとも、今回のテキストマイニングで最終的にやりたいことが「まだ見ていない視聴者におすすめする」という点は変わらないようにしなくてはなりません。例えば、「どうすれば楽しめるようになるかを考察する」や「制作陣はどうすれば良い作品だと評価されるようになったのかを考察する」といった方向に変わってしまっては、テキストマイニングをやる意味が無くなってしまいます。
もちろん、目的が何であっても、分析をすれば何かしら有意義な結論は得られるでしょうが、その結論が最初の目的や、そもそもやろうとしていたことと合致していない以上、有意義な行動には結びつかないということになります。結局活用されないのであれば、それはまったくの無価値な知見と言うことになります。
とはいえ、ぶっちゃけ今回はKH Coderを使ってみるのが一番の目的なので、どんな方向性であれ何かしら面白い結論が得られれば僕としてはオッケーなんですが。
やること
すでに何度か書いていますが、「Amazonレビューをテキストマイニングする」ことが今回やることになります。テキストマイニングをする際には、KH Coderというフリーソフトを使いました。
Amazonレビュ-だけじゃなくて、Twitterなんかからもデータを取れたらもっと良い分析ができたんでしょうけど、それが出来なかったんで(というか、やりたくないです。7日前以前のデータはお金を払わないと取れないんで)、今回はAmazonレビューを分析しました。
今回使ったAmazonレビューは2019年12月20日までに書き込まれたレビューになります。2019年12月20日にコピーしたんで、その日の分の書き込みも一部含まれています。レビュー数は全部で500個でした。
ただし、後での分析のために、レビューの中にある「PSYCHO-PASS」という単語は「サイコパス」へとすべて変換しておきました。
レビュー1つをExcelの一つのセルに入力しました。それと、一応作品に対する評価と、レビューの投稿日も保存しておきました。手がつりそうで大変だったぁ。
で、そのレビューを使って不評の原因を調べました。
次の節からがKH Coderを使っての分析作業になります。
前処理
まずは、次のようなリストを作って前処理をしました。作品固有の単語は自動では抽出されなかったので、強制抽出語リストに入れました。
強制的に抽出する語
—cell—
常守
狡噛
虚淵
メンタルトレース
慎導
監視官
抽出しない語
—cell—
常
守
狡
噛
慎
導
監視
その結果、次の図1のような抽出語リストが出てきました。
この結果を見ると、PSYCHO-PASSという作品のレビューなので、キャラのことや面白さ、サイコパス(PSYCHO-PASS)といったアニメ特有の単語が多く使われていることが分かります。
Amazonレビューでは低評価が多かったにもかかわらず、「面白い」という単語が頻出語の上位に来ているという点を疑問に思ったので、「面白い」と一緒に使われていた単語を調べてみると、「ない」という単語が最もよく使われていました。つまり、「面白くない」とか「面白いとは感じない」みたいな感じで使われることが多かったってことですな。
※注意、「面白い」という単語はすべての活用形のものが抽出されています。つまり、「面白い」だけでなく「面白く」や「面白かっ」などと書かれていても「面白い」としてカウントされているということです。
「○○という点が面白くない」とか「面白いとは感じない○○」みたいな感じで使われている可能性が出てきたってことなんで、不評の原因は探れそうでひとまず安心です。原文を確認すると、実際にそういう表現があったんで、Amazonレビューが目的にかなったデータであることが分かりました(不評の原因を探るって目的に適ってるかどうかは疑問の余地がありますが)。
というわけで、上位に「面白い」という単語が来ているのは、「面白くない」という感想が多かったからで、視聴者が面白いアニメではないと感じたからであることが伺えます。まぁ、星評価の通りですな(たしか、2019年12月20日時点での評価は2.9辺りだったはず)。
次の節から、どういう部分のせいで面白くないと感じることとなったのかを分析していきたいと思います(ウソで、かつホント)。
不評の原因を調査
では、データが使えそうだということが分かったので、より適切なポイントに注目するためにKH Coderの機能を利用します。その機能というのが…という感じで続けていきたいんですけども、長くなりすぎたんで、次に続くということにしておきます。
※注意
この記事に書いている分析や分析結果は一例であって、その内容の真偽を保証する物ではありません。あくまでAmazonレビューをテキストマイニングした結果から考察したものですので、実際とはかけ離れている可能性がありますので、ご注意ください。
この記事の分析や分析結果をご使用になって生じた損害について、Akitoは一切責任を負いません。この記事の分析または分析結果をご使用になる際には自己責任でお願いします。