“Bollen准教授のチームは、『Google』の膨大なデータベースを調査して、もともとの72の形容と関連して使われることの多い語句を探し、 語彙リストに加えた。次に、チームは2008年2月から12月までの期間に270万人のTwitter利用者が投稿した980万件のツイートを対象に、感 情を吐露したと見られるツイートを選択し、このデータセット全体に対してテストを実施した。
正常に動作していることを確認するため、チームは2008年米大統領選の投票日や感謝祭など、一般社会の気分の予測が容易ないくつかの日付をチェッ クした。その結果は予想通りだった。Twitterの世界は、投票日の前日には不安が漂っていたが、投票日当日にはずっと平穏で、幸福な気分や善意が広 がっていた。投票日翌日の11月5日までには、すべて平常値に戻った。また、感謝祭の日には、Twitterの「幸福」度は突発的に上昇した。
その後、ほんの好奇心から、大学院生のHuina Mao氏が、この社会の気分を、ダウ・ジョーンズ工業株価平均と比較してみた。すると、6つのうち「平穏」の尺度が、株式市場の上下動と、驚くほど同じ動 きをしていることが分かった――ただし、気分の動きのほうが3〜4日先を行っていた。
だが、この驚くべき相関関係だけでは、Twitterが未来予想に使えるかどうかは分からない。この仮説を検証するため、研究者らは、株式市場の上 昇または下降を予測できるよう、機械学習アルゴリズムに調整を行なった。そして、最初は過去3日間のダウ・ジョーンズ工業株価平均のデータのみを用い、そ の後気分のデータを含めるようにした。
株式市場のデータのみを使った場合も、アルゴリズムはかなり健闘し、73.3%の精度で株式市場の状態を予想した。しかし気分の情報を加えたところ 精度はさらに向上し、最高で86.7%まで跳ね上がった。Bollen准教授は、今回使ったアルゴリズムは単純なものであり、より高品質なものを使えば もっと成績が向上する可能性があると指摘している。
”