こんにちはbudouです!
今回は最近Twitterで話題になった「あの」問題に関してデータの視点で見てみたいと思います!!
はじめに
Twitterで詐欺事件として話題になった「竹花貴騎さん」ですが、色々と話題になった中でTTMつよしさんがご自身YouTube↓↓
まだ話したい「竹花貴騎経歴詐称の擁護派はやばい」って思う理由
こちらの(5:00辺りから)中で、
「竹花擁護派」は結果を出していなさそうな人(影響力が少ない?)
という事を仰っていたので、こちらを実際のTwitterを見ながら深掘りしていけたらと思います!
結論:実は 「竹花援護派」は「竹花否定派」よりも、影響力が少ない人の集まりだった!
目次
分析を行う上での前提
検証期間:2020/10/31~2020/11/1の二日間
竹花擁護派:ツイートの内容をネガポジ分類した上でポジティブな意見が多い人を擁護派と今回は定義した
竹花否定派:竹花擁護は以外の人を竹花否定派として定義した
結果を出している事:フォロワー数で判断
データ収集
データ収集のルール
ツイートの中に下記5つの単語どれか一つでも含まれているものを今回の解析の対象とした。
- "竹花"
- "竹花貴騎"
- "MUP"
- "MUPカレッジ"
- "竹花財団"
データ収集の期間
2020/10/31~2020/11/1の2日間
※「2日間」に意味はありません。もっと過去から集めたかったのですが、収集慣れてなくて今回二日間になっちゃいました。次にやるときはもう少し長めに取れたらと思います。
結果として、5343件のツイートを集めることが出来ました。
データ前処理
データ前処理1.今回のテーマに対して不要なツイートを削除
アカウント名にmupと入っていて「竹花問題と無関係のツイート」を削除
単純にRTだけしているツイートを削除
データ前処理2.ユーザー単位にネガティブな事を多くツイートしている人と、ポジティブな事をツイートしている人を分ける。
今回は、ネガポジ分類を楽に出来るようにして下さったこちらosetiを利用させて頂きました。
上手く出来るかどうか不安だったのですが...
・動画が非公開になってた。ぴえん。
・熱く語る姿は魂を揺さぶられます!引き続き学びの場を提供してください!
・今はしんどいかもですが、頑張ってほしいです。
取れてる取れてる*1 (* ̄m ̄)ムフフフ
でも見た感じの所感として、60..70%くらいしか擁護派の意見はちゃんと取れてないかな。(否定派の意見も交じっている)という感じでした。ツイートの分類難しい..。
データ前処理3.大型インフルエンサーを除く
今回は「フォロワー数が多い」をTTMつよしさんの言われている"結果を出している事"としたいと思いますので、スーパーインフルエンサーを除く。群衆を乱す5000人以上フォロワーがついている人を群衆と一緒に混ぜると色々と乱されてしまうので...除外!
ここまでで最終的に、
否定派:682人
擁護派:166人
と分けることが出来ました。*2
結果.「竹花擁護派」「竹花否定派」においてフォロワー数に違いはあるのか?
ここまでで2つのグループの整理が出来ました。
この二つのグループ間のフォロワー数において、違いがあるのか?というの統計検定を用いて見てみたいと思います。
・
・
・
(結論先に書いてるのでもったいぶる意味はないか。。)
t値:2.056
P値:0.040
ということで、5%水準で見たときに統計的に有意に差がある。ということが言えそうです。
※t値、P値の説明はこの辺をご参照ください。
おわりに
「竹花問題」として炎上案件となった本件に対してYouTubeサーフィンしているときに面白いなと思ったTTMつよしさんが仰っていた、
「竹花擁護派」は結果を出していなさそうな人
「竹花否定派」は結果を出していそうな人
に関して少しだけ深掘りしてみましたが如何でしたでしょうか。
結論として、本件擁護している人は、比較的影響力の少ない人(フォロワー数少ない人)が多そうだ。 ということが見えて面白かったです。