ヤフーは、1月に発表済みの「Yahoo!ビッグデータ」を用いたインフルエンザと Yahoo! 検索の関連性分析について、追加検証を発表した。今回の分析でも、検索数と患者数に相関関係があった。

前回のレポートでは1月20日までのインフルエンザ検索数推移と厚生労働省の患者報告数の推移を比較したが、今回はその後4月7日までのデータを比較した。その結果によると、両統計のピークや減少のタイミング、下げ幅などに強い相関関係があることがわかった。さらに、増減の割合に関しては検索数にくらべて報告数のほうが変動が大きいことも判明した。

「Yahoo!ビッグデータ」による“インフルエンザ”の流行分析に追加レポート
ほぼ同じ推移を辿っている

また、縦軸を「先々週と先週との検索割合スコアの伸び率」、横軸を「検索割合スコア」とした「各都道府県別のインフルエンザ状況マップ」では、前回の1月14日〜1月20日において感染拡大中に該当する分布になっていたが、そこから2週間後、1か月後では患者数の減少とともに停滞域や終息域へ分布が移り変わったことが判明した。この結果から、検索数を見るとほぼリアルタイムでインフルエンザの感染状況を知ることが可能ではないかという結論が得られた。

2月後半の分布ではインフルエンザが終息していることがわかる
2月後半の分布ではインフルエンザが終息していることがわかる

一方、今年は成人のインフルエンザ感染者が多く、治療薬処方数の年代別分布に特徴が見られたが、検索の年代別分布は例年と変わらず、両統計に相関関係がないため検索数の年代別分布から実際の患者の年代別分布を推測することは難しいことが判明した。この理由として、インフルエンザ患者が未成年の場合、保護者などがインフルエンザを検索する傾向が推測される。

検索者の年代はほとんど変わらない
検索者の年代は毎年ほとんど変わらない