2021.03.30

携帯GPSデータに基づく時間帯別地域メッシュ訪問解析による移動パターン分類と実効再生産数相関分析

担当

RQ4研究統括 産業技術総合研究所 野田五十樹

対応するリサーチクエッション

「第二波対策」として必要な「感染予測・対策の効果検証」(SIRモデルの代替となるモデルの確立)、「必要な医療リソース(病床・医療物資等)の需要予測と最適配置」


概要

  1. • 地域メッシュごとの訪問者の特徴を移動データから分析
  2.  •地域メッシュ:200m メッシュ
  3.  •移動データ:何日の何時にどれくらい遠くから何人訪問したか?
  4.  •メッシュを取り出す地域:東京・大阪・名古屋の中心部半径5km内。

  5. •手法:
  6.  •Step1: 平時(2020年2月)の移動データでメッシュ分類。
  7.    •テンソルの非負値要素分解により少数の移動パターンに分類。
  8.  •Step2: 通年(2020年1年分)の移動データで、時間方向の要素のみ調整。
  9.    •メッシュ分類成分(メッシュ軸成分×距離軸成分)はStep1のものを利用。
  10.  •Step3: 時間軸成分(時間変化パターン)と実効再生産数の変化の相関分析。
  11.    •曜日効果を軽減するため、7日間の移動平均でデータを平滑化後、分析。
  12.    •近隣県の実効再生産数とも相関分析。

  13. •結果:
  14.  •いずれの都市も、観光・歓楽移動パターンと実効再生産数に強めの相関。
  15.    •ただし、東京は相関が弱め。他の要因も考慮する必要がある。
  16.  •近隣県では、強く相関するところとそうでないところがある。


東京のメッシュの分類

本拠地までの距離・時間帯毎の各メッシュへの訪問者数

  1. •各メッシュへの訪問者数を、本拠地からの距離・時間帯ごとに集計
  2.   •本拠地:その日の午前3時に居たメッシュ
  3.   •距離:100 * 2k 毎に離散化
  4.   •時間帯:6,9,12,15,18,21,24時
  5. •除外データ
  6.   •1日中位置の変わらないデータ
  7.   •「変」なメッシュ(ありえない位置)を通るもの
  8. •地域: 赤坂御所中心に 5km 圏内
  9. •期間:2020年2月1日〜29日
  10. •「訪問メッシュ」×「距離」×「時間帯」のテンソル
  11.   •正規化により確率テンソルとする。

Map data  ©2021 Google

Tensor

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:メッシュ番号

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:本拠地からの距離(対数)
  1. •集計データ
  2.   •mesh × dist. × hour


テンソルの分解

  1. •3次元テンソルを、各次元のベクトルの直積の混合として分解
  2.  •分解数: BIC 分析に基づき、決定(次ページ)
  3.   •6要素に分解



分解数とBIC

•n=6 で最小。



分解された要素 (p0-p2)

factor-0 職場

factor-1 自宅(朝)

factor-2 買い物

 

分解された要素 (p3-p5)

factor-3 自宅周辺

factor-4 自宅(夜)

factor-5 歓楽


factor-0 職場

Map data ©2021 Google


factor-1 自宅(朝)

Map data ©2021 Google


factor-2 買い物

Map data ©2021 Google


factor-3 自宅周辺

Map data ©2021 Google


factor-4 自宅(夜)

Map data ©2021 Google


factor-5 歓楽

Map data ©2021 Google


実行再生産数(Rt)の変化

各factor の変化(通年)

各factor と Rt の相関(200日目以降)

  1. •注意
  2.  •200日目以降とした理由:
  3.   •200日目以降はRtの推定が安定していると見なせるため。
  4.    •Rt の推定では、陽性者数が少ないと大きな値となりがち。
  5.    •仮定している事前分布に起因
  6.   •感染初期は、対策法・行動様式の変化が大きく、分析対象として不安定


相関散布図(factor-5)

東京

神奈川

埼玉

千葉

茨城

大阪のメッシュの分類

産業技術総合研究所 野田五十樹

本拠地までの距離・時間帯毎の各メッシュへの訪問者数

  1. •各メッシュへの訪問者数を、本拠地までの距離・時間帯ごとに集計
  2.   •本拠地:その日の午前3時に居たメッシュ
  3.   •距離:100 * 2k 毎に離散化
  4.   •時間帯:6,9,12,15,18,21,24時
  5. •除外データ
  6.   •1日中位置の変わらないデータ
  7.   •「変」なメッシュ(ありえない位置)を通るもの
  8. •地域: 船場中心に 5km 圏内
  9. •期間:2020年2月1日〜29日
     •「訪問メッシュ」×「距離」×「時間帯」のテンソル
  10.   •正規化により確率テンソルとする。



  1. Map data ©2021 Google


Tensor

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:メッシュ番号

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:本拠地からの距離(対数)

•集計データ

 •mesh × dist. × hour

テンソルの分解

  1. •3次元テンソルを、各次元のベクトルの直積の混合として分解
  2.  •分解数: BIC 分析に基づき、決定(次ページ)
  3.   •6要素に分解



分解数とBIC

•n=6 で最小。

分解された要素 (p0-p2)


factor-0 自宅(朝)


factor-1 歓楽・観光

factor-2 出勤


分解された要素 (p3-p5)

factor-3 買い物?

factor-4 自宅付近

factor-5 自宅(夜)


factor-0 自宅(朝)

Map data ©2021 Google


factor-1 歓楽・観光

Map data ©2021 Google


factor-2 出勤

Map data ©2021 Google


factor-3 買い物?

Map data ©2021 Google


factor-4 自宅付近

Map data ©2021 Google


factor-5 自宅(夜)

Map data ©2021 Google


実行再生産数(Rt)の変化

各factor の変化(通年)

各factor と Rt の相関(200日目以降)

  1. •注意
  2.  •200日目以降とした理由:
  3.   •200日目以降はRtの推定が安定していると見なせるため。
  4.    •Rt の推定では、陽性者数が少ないと大きな値となりがち。
  5.    •仮定している事前分布に起因
  6.   •感染初期は、対策法・行動様式の変化が大きく、分析対象として不安定


相関散布図(factor-0)

factor-0 自宅(朝)

大阪

京都

兵庫

和歌山

奈良

相関散布図(factor-1)

factor-1 歓楽・観光

大阪

京都

兵庫

和歌山

奈良

相関散布図(factor-3)

factor-3 買い物?

大阪

京都

兵庫

和歌山

奈良

相関散布図(factor-5)

factor-5 自宅(夜)

大阪

京都

兵庫

和歌山

奈良

名古屋のメッシュの分類

産業技術総合研究所 野田五十樹

本拠地までの距離・時間帯毎の各メッシュへの訪問者数

  1. •各メッシュへの訪問者数を、本拠地までの距離・時間帯ごとに集計
  2.   •本拠地:その日の午前3時に居たメッシュ
  3.   •距離:100 * 2k 毎に離散化
  4.   •時間帯:6,9,12,15,18,21,24時
  5. •除外データ
  6.   •1日中位置の変わらないデータ
  7.   •「変」なメッシュ(ありえない位置)を通るもの
  8. •地域: 栄南中心に 5km 圏内
  9. •期間:2020年2月1日〜29日
     
  10. •「訪問メッシュ」×「距離」×「時間帯」のテンソル
  11.   •正規化により確率テンソルとする。


Map data ©2021 Google

Tensor

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:メッシュ番号

  1. 横軸:日付・時間帯(29日×7時間帯)
  2. 縦軸:本拠地からの距離(対数)
  1. •集計データ
  2.  •mesh × dist. × hour


テンソルの分解

  1. •3次元テンソルを、各次元のベクトルの直積の混合として分解
  2.  •分解数: BIC 分析に基づき、決定(次ページ)
  3.   •4要素に分解


分解数とBIC

•n=4 で最小。

分解された要素 (p0,p1)

factor-0 自宅(朝夜)

factor-1 出勤

分解された要素 (p2,p3)

factor-2 自宅付近

factor-3 観光・歓楽

factor-0 自宅(朝夜)

Map data ©2021 Google


factor-1 出勤

Map data ©2021 Google


factor-2 自宅付近

Map data ©2021 Google


factor-3 観光・歓楽

Map data ©2021 Google


実行再生産数(Rt)の変化

各factor の変化(通年)

各factor と Rt の相関(200日目以降)

  1. •注意
  2.  •200日目以降とした理由:
  3.   •200日目以降はRtの推定が安定していると見なせるため。
  4.    •Rt の推定では、陽性者数が少ないと大きな値となりがち。
  5.    •仮定している事前分布に起因
  6.   •感染初期は、対策法・行動様式の変化が大きく、分析対象として不安定


相関散布図(factor-0)

愛知

岐阜

三重

静岡