線形回帰を使って7日後の東京の感染者数を予測してみた

線形回帰を使って7日後の東京の感染者数を予測してみた

緊急事態宣言が出て、外出しづらくなったので、家で東京の感染者数を予測してみることにしました。

実はGoogleが感染者数や志望者数を予測するというサービスを展開しているのですが、精度が明らかにイマイチなので、もうちょっといい精度で予測できるのではないかと思って線形回帰分析により計算してみました。

利用したデータ:東京都新型コロナウィルス感染症対策サイトのモニタリング指標・その他の指標、気象庁 過去の気象データの温度・湿度

線形回帰の方法:pythonのscikit-learnライブラリによる線形回帰(説明変数の2乗項と交差項も説明変数に追加して計算)
目的変数を7日後の感染者数としてそれ以外のデータを説明変数として線形回帰を行いました。

色々書きましたが、結果のグラフを見てもらった方が分かりやすいので、載せます。下図が横軸を日付、縦軸を東京都内の日別新型コロナウィルス感染者数としたグラフです。なお、オレンジ色の線が実測値で青色の線が今回の線形回帰で導いた予測線です。見た目はまぁまぁ予測できているように見えます。

意外とすぐに3000人超えそう

いつ頃3000人超えるのか気になっている方が多いでしょうが、予測グラフによると1/14に3000人超えそうです。

救急相談センターの指標を東京都が重視している理由

今回、線形回帰をしてみて救急相談センターの指標を東京都が重視している理由が分かりました。

それは【7日後の感染者数】に対して相関係数が高い説明変数が【その日の感染者数】と【救急相談センターへの発熱相談数】の交差項だったためです。

東京都がどのような分析手法をとっているかはわかりませんが、やはり統計解析で【救急相談センターへの発熱相談数】と感染者数の増加に相関があると判断しているのでしょうね。

※当サイトは統計学に基づいた予測値を掲載しておりますが、これは将来を保証するものではありません。