重要ポイント
・日本における新型コロナウイルス感染症に関する定量分析や定量的なディスカッションを行う際に、データの収集・加工は大きなハードルとなっている。
・理由①:フォーマット(PDF、EXCEL等のファイル形式やデータ構造)が統一されていない。
・理由②:同じ名前のデータでも定義が異なる場合がある。
・例:重症患者数(国基準)、重症患者数(旧都基準・新都基準)、重症患者数(大阪府基準)
・理由③:データを公表する機関・タイミングがバラバラである。
例:ワクチンデータを収集する場合
・ワクチン(一般接種)→デジタル庁
・ワクチン(医療従事者、2021/04/09以前のデータ)→厚生労働省
・ワクチン(医療従事者、2021/04/12以降のデータ)→首相官邸
分析
・そこで、新型コロナウイルス感染症に関連するデータを自動で収集し一元化・都道府県(+全国)パネルデータとして無償で提供。
・日次データと、日次データを加工した週次データを同時に提供。
・収集データは 人口, 感染状況, 医療提供体制, 行動制限有無, ワクチン, 人流, 気象, etc. など多岐にわたる。
・都道府県別にこれだけの情報量を盛り込んだデータセットはこれまでに発表されていない。
・本データセットは因果推論等のデータ分析やモデル分析に自由に活用可能。
・データはサーバー上で毎日(※一部データは毎週)自動的に更新。
・本データセットを利用することにより、分析のために必要なデータ収集・加工等の煩わしい作業を、大幅に短縮できる。
免責事項
・本データセットに掲載されている情報の正確性については万全を期していますが、我々は利用者が本データセットの情報を用いて行う一切の行為について責任を負うものではありません。
・また、利用者が本データセットを利用したことにより発生した利用者の損害及び利用者が第三者に与えた損害に対して、責任を負うものではありません。
・本データセットに掲載されている情報は、予告なしに変更又は削除することがあります。
・本データセットは、東京大学の仲田泰祐・岡本亘が研究者個人として開発しているものです。東京大学は本データセットに関する一切の責任を負いません。
データ可視化:COVID-19 Standard Dashboard