はてなDiaryから移行してみました。
記事一覧

人によっては「夏かし」と呼ばれているものです。

第4回AKB選抜総選挙に対して行われた順位予想の評価をしました(最終版)。

昨日(2012.6.10)、第4回の選抜総選挙に対して行われた約20個の順位予想に対して行った評価について、以下の記事を書きました(評価値の算出法も記載してあります)。

しかし、この評価の対象は、速報(5月23日)が発表される前に行われた順位予想のみでした。今回は、速報後に出された4つの順位予想の評価をこれに加えます。

まず、前の記事を若干振り返ることにします。評価対象にしたものは、22個のものでした。しかし、この中には日刊スポーツの6人の記者によって行われた予想を私が平均したものが含まれていましたので、実際は21個です。この内の上位10位までに対する評価値を以下に示します。なお、事情により、評価が14位であった“i love data ”による順位予想もリストに加えます。

1位は日刊スポーツの大友記者による順位予想でした。そして、2位は週刊プレーボーイに掲載されたものであり、有識者5人の合議制により作成された順位予想でした。二つの順位予想の評価値は若干違いますが、予想の精度はそれほどは違わないように見えました。

順位 名前 所属 評価値
1 大友記者 NikkanSpo 1.235
2 週刊プレイボーイ - 1.264
3 2chスレッドの平均 - 1.316
4 日刊スポーツ平均 NikkanSpo 1.323
5 松田デスク NikkanSpo 1.345
6 柳田デスク NikkanSpo 1.455
7 宇野常廣 AKBofficial 1.558
8 natuka_shinobu - 1.625
9 森本記者 NikkanSpo 1.691
10 横山記者 NikkanSpo 1.992
14 “i love data ” - 2.602

評価値が5位までの順位予想と、実際の順位を、表に示します。

さて、なぜ、評価が良くなかった“i love data ”による順位予想の評価値も示したかというと、“i love data ”が開票直前に発表した順位予想を、今回の評価対象に加えるからです。この他に、私が以前に行った順位予想を、速報結果を観た後に修正したものも加えます。これは、速報結果を観ることが予想の向上につながるか否かを調べるためです。その他に、毎日新聞が関係する2つの順位予想を評価対象に加えました。

以下のこの4つの順位予想を説明し、表に示します。


★★New1★★ “i love data” によるデータに基づくによる直前順位予想

“i love data ”が、選抜総選挙の開票2日前(6月4日)に、直前予測を発表しています。以前の順位予想との違いは、以下のように説明されています。

(抜粋)
そこで、今年も5/23に行われた速報発表後の書き込み数の推移に着目し、速報発表に伴う書き込み数の一時的な急増が落ち着く5/25と、今回のデータ取得最終日となる5/26を比較してみると、速報で4位となった指原莉乃や、6位となった篠田麻里子について、書き込み数が大きく伸びていることが分かります。
そこで、今回の直近予測では、速報発表後にブログやTwitterでの書き込みが増加しているメンバーについて、その増加割合を「応援係数」として、上記モデルで得られた予測得票数に加算するという調整を行っています。

<直近予測> データで予測する2012年第4回AKB選抜総選挙 - ilovedata - ビッグデータを活用するための情報ブログ


★★New2★★ 毎日新聞デジタルが行ったデータ分析による順位予想
毎日新聞デジタルが、以下の計算式に従って行った順位予想です(表では、「データ分析〔毎日〕」と記述」)。

(抜粋)
今回行ったのは、速報での獲得票数(A)から最終投票数(B)までの伸び率(BをAで割った商)を昨年の実績を基にはじき出し、今年の速報での獲得票数にかけて、今年の最終得票数を割り出すという単純計算。今回は前回より投票期間が1日短いが、全体投票数の増減はじめ、今回参加しない前田さんの票の行方、特殊要因による票の増減など、他の要素は一切考慮していない。

AKB48総選挙:焦点は2位争い 柏木、まゆゆを珠理奈が猛追 データ分析 - MANTANWEB(まんたんウェブ)


★★New3★★ 毎日新聞デジタルによるファンの投票動向調査(「マクロミル」が協力)
毎日新聞デジタルが、調査会社「マクロミル」の協力により、ファンの投票動向に関する独自調査を実施した結果です。これは、順位予測とは違うのですが、順位予測として評価対象にすることにします(表では、「マクロミル〔毎日〕」と記述」)。

なお、この調査は、「速報結果の上位64人の名前から1人だけ選ぶ形で回答を募った」となっていますから、複数投票の影響は、取り込まれていません。

(抜粋)
調査は約2万人の中から、今回のAKB48選抜総選挙に「興味がある」か「投票する(した)」と回答した515人(男性272人、女性243人)を対象に実施。5月23日に発表された速報結果の上位64人の名前から1人だけ選ぶ形で回答を募った。

AKB48総選挙:大島圧勝の勢い “前田票”3割取り込む……独自調査結果 - MANTANWEB(まんたんウェブ)


★★New4★★ 私(natuka_shinobu)が、速報結果を基にして出した順位予想
私が、速報前(4月4日)に行った順位予想を、速報結果を観た後に修正したものです。1〜9位までにおける以前との違いは、以下のものです。

1、2位と6〜9位は、以前の予想と同じです。3〜5位は、3位の篠田麻里子を5位に下げて、渡辺麻友指原莉乃を1位づつ上げました。

第4回AKB48選抜総選挙の速報結果を踏まえた、順位予想 - 夏かしのブログ



それでは、順位予想に対する評価結果を、新たな4つの順位予想に対するものを含めて、評価の高い順に示します。
今回、付け加えた4種類の順位予測では、私(natuka_shinobu)による修正versionの順位予測が1位、毎日新聞データ分析が2位、“i love data ”直前予測が13位、毎日新聞マクロミルが18位でした。

順位 名前 所属 評価値
1 natuka_shinobu修正 - 1.051
2 毎日新聞データ分析 - 1.213
3 大友記者 NikkanSpo 1.235
4 週刊プレイボーイ - 1.264
5 2ch - 1.316
6 日刊スポーツ平均 NikkanSpo 1.323
7 松田デスク NikkanSpo 1.345
8 柳田デスク NikkanSpo 1.455
9 宇野常廣 AKBofficial 1.558
10 natuka_shinobu - 1.625
11 森本記者 NikkanSpo 1.691
12 横山記者 NikkanSpo 1.992
13 “i love data ”直前 - 2.066
14 瀬津記者 NikkanSpo 2.257
15 三杉武 AKBofficial 2.397
16 嶽本野ばら AKBofficial 2.470
17 “i love data ” - 2.602
18 毎日新聞マクロミル - 2.75

“i love data ”直前予測は、以前の予測(17位)よりは、4位向上しているのですが、それほど成績が上がっていません。これは、1人が複数投票をすることをモデルに含んでいないので、当然だと言えます。毎日新聞マクロミルの成績が悪いのも、同様の理由です。

毎日新聞データ分析が2位になったのは、正直言って予想外でした。このようなシンプルなやり方が2位となるとは思ってもみませんでした。

さて、私(natuka_shinobu)による修正versionの順位予測が1位となっていることには、当惑してしまったのですが…、これは単に、速報結果を真面目に解釈して予想し直すと、順位予想が向上するということ意味しているだけです。もし、大友記者(日刊スポーツ)が、速報結果を真面目に解釈して、予想し直したならば、私の予想よりも、もっと良い予想になった可能性は非常に高いです。


最後になりましたが…、今日の朝、非常に驚いたことがありました。本日、見つけた日本経済新聞の記事(6月8日)によると、ここでは「“i love data ”直前」と記しており、評価が高くない予想が、「選抜メンバー16人中15人を的中させた」と大絶賛されているのです。評価基準が違えば評価が違ってくることは確かなのですが、不思議です。

確かに、「“i love data ”直前」は「選抜メンバー16人中15人を的中させた」のですが、少なくない人が的中させていると思います。また、この点だけに着目すれば、偶然に的中したということがあり得ます。

AKB48に関してある程度以上の知識がある人には、「“i love data ”直前」の予想を、問題がある順位予想と判断すると思います。それは、板野友美を4位、柏木由紀を6位、渡辺麻友を7位としているからです。日経の記者は、これらのメンバーをあまりご存じがなく、記号としてメンバーを扱っているので、この予想に違和感を感じないのかもしれません。


それから、おそらく、私と、日経の記事を書かれた方とは、世界観が違うのだと思います。私の感覚では、そこらへんのAKB48に少し詳しい人が、それほど困難なく行った予想よりも精度が良くはない予想を、「ビッグデータ」を駆使なくては成し遂げられないことは、時間とお金の著しい無駄遣いに感じます。

―――以上―――