足ることを知らず

Data Science, global business, management and MBA

AKB第3回総選挙をデータで振り返ってみる。

正直、柏木由紀篠田麻里子以外、AKB48に全く興味はないのだが、あまりにテレビで持ちあげられているため、これは何かしないとなと思い、ちょっとガチンコでAKB48総選挙を振り返ってみます。

基本情報の整理
さて、今回の投票ですが、皆さんご存じ「Everydayカチューシャ」とモバイル会員?の両方からの投票が可能だったようです。

CDは約145万票の権利があり、うち投票されたのは77万9090票で、投票率53.7%でした。
ファンクラブ会員からの投票は38万7055票で、合わせて選挙総票数は116万6145票でした。

8:2の法則は適用されているか?
8:2の法則とはパレートの法則 - Wikipediaのことです。要は、上位2割で、今回の総選挙の8割近くが説明出来るのかという疑問です。
さてさて、ではランキングをおさらいしてみましょう。

注目すべきは積み上げシェアの部分です。
これは、各立候補者の得票数を選挙総票数で割ったものをシェアとし、上位から足し上げていったものになります。

なんと、この選挙、150名の立候補者のうち、上位40名で92%のシェアを持つ選挙なのですね。
もっと言うと、4位の篠田麻里子までで全体の1/3、8位の板野友美までで全体の半分の票数となります。
20位までいくと約8割ですから、いかにこの選挙が「上位に偏った」ものかわかるでしょう。150人中20人、即ち約13%で8割の投票を獲得しているのですから、完全に「8:2」の法則に当てはまっています

速報はアテになるのか?
次に、速報と開票結果の関係について考えてみましょう。速報とは5/25に出た総選挙速報のことです。
総選挙速報は開票最終結果に対して、どれくらいの割合なのでしょうか?

速報開票数/最終得票数

を速報値シェアとしています。


まず、わかりやすいのは若干SKEメンバー速報値比率がかなりばらついています
原因は全くわかりませんが、どこかの都市に偏った票開示だったのか、SKEの中で速報値に対応した大規模投票が行われたかのどちらかです。

とはいえ、大体10〜20%の投票数が速報で開示されていることになります。
ある程度まとまっている速報値と選挙総数の比率を元に、速報値から考えられうる投票総数の最高値と最低値を考えてみましょう。
また、これを用いて、速報値から、「●○は大体何位から何位の間になる」と順位予想することも可能です。

これは、速報値比率を元に、速報値から信頼水準95%の区間推定を行っています。

ここから判断するに速報値開示の時点で7位の指原莉乃が1位の大島優子を逆転することはほぼないと言えます。
また、速報値の段階で、20位の倉持明日香までは、圏外になることがないと保証されています。

実際の順位と照らし合わせてみても、この区間推定は全て事実と整合した結果となりました。


というわけで、ちょっと色々振り返ってみたのですが、意外とはまってしまいました。



チームごとのシェア

最後に、チームごとの得票シェアを円グラフにして貼っておきます。


9割近くがAKBですねという結果でした。また、AKBの中でもチームAが圧倒的です。他チームの2倍弱の差をつけていますね。