携帯電話などのビッグデータから人流データを集計し分析をする事例は増えてきていますが、特に近年では、ビッグデータ以外のデータも組み合わせて、より多様な情報が付与されたリッチな人流データを生成する取り組みが増えてきています。
今回の記事では、そのようなデータフュージョンによる人流データの生成にはどんなメリットがあるのか、またどんな風に生成が行われているのか、その概要を紹介していきたいと思います。
データフュージョンによる人流データの生成とは?
データフュージョンとは、シミュレーションモデルを核として、携帯電話のビッグデータや道路交通量等の観測データ、国勢調査等の基礎データ、都市交通調査(パーソントリップ調査)等による個人の行動データを組み合わせ、一人一人の人の動き(人流)を生成する手法のことを指します。
ここで言うシミュレーションモデルとは、アクティビティベースドモデルや機械学習等のモデルが該当します。上記の各データを用いてモデルを作成したり、モデルの出力が各データと整合するようにキャリブレーションすることで、様々なデータの特性を反映した人流データを生成することができます。
データフュージョンするメリットは?
ビッグデータを加工・集計して作成する通常の人流データと比べて、データフュージョンにより人流データを作成することのメリットはどこにあるのでしょうか?
ここでは、そのメリットを5つ挙げたいと思います。
① 一人一人の非集計データから、様々な分析が自由度高く行える
一人一人が、どこに何の目的に何の交通手段で何時に移動しているのかというデータ(いわゆるパーソントリップ調査のようなデータ)が生成されます。
一人一人の移動データを集計することで、トリップ数、外出率、分担率などの様々な指標を算出することができます。
さらに、トリップ数を性別や年齢、就業形態、世帯構成、免許保有など様々な属性別に自由に分析することが可能となります。
② 各種データと整合のとれたデータが扱える
データフュージョンで生成した人流データは、観測交通量や携帯電話のビッグデータ、国勢調査の人口等の各種データと整合が図られるように生成されます。
そのため、説明力も高いデータとなっていることが特徴として挙げられます。
③ 個人情報と紐づいてないため、誰でも非集計データが扱える
一人一人の行動データといっても、実際に存在する人の動きを追跡したものではなく、シミュレーションにより仮想的に生成した人の動きとなります。
そのため、個人情報に該当することはなく、オープン化や外部提供がしやすい非集計のデータとなっています。従来の携帯電話等のビッグデータでは、個人情報の関連で事業者以外にデータを提供することは困難だったり、厳重な秘匿処理が必要だったりしましたが、データフュージョンにより生成した人流データはそういった懸念はありません。
④ リアルタイムにデータが生成できる可能性がある
データフュージョンするデータに、携帯電話のビッグデータや常時観測されている交通量を組みこむことで、それらのデータの変動に合わせたリアルタイムの人流データの生成が可能となります。
リアルタイムの人流データ生成は、毎日の人流のモニタリングというだけではなく、リアルタイムの人の流れに応じた混雑情報や経路案内などの情報提供、災害発生時の情報提供や避難誘導などへの活用も期待されます。
⑤ 施策や将来のシミュレーションに活用できる可能性がある
データフュージョンでは、アクティビティベースドモデルや機械学習等のモデルが核となっています。
これらのモデル上で、交通の所要時間や施設の配置が変数として含まれていれば、これらの変数を施策に応じて変更することで、交通施策やまちづくり施策によって人の移動がどのように変わるのかを予測することもできます。
このような施策シミュレーション機能が実装されることで、同じ仕組みを用いながら、現況分析から施策評価までの一連の検討を、シームレスに誰でも行うことができるようになる世界が実現されます。
データフュージョンの事例紹介
疑似人流データ(人の流れプロジェクト)
疑似人流データとは、「オープンデータとして公開される統計データと、建物データ等の低廉に入手可能な地理空間情報のみを用いることで全国総人口に対して典型的な日常の行動を表現する人流データ」(引用:人の流れプロジェクト)です。
東京大学空間情報科学研究センター「人の流れプロジェクト」が、全国の研究者を対象に提供しているものになります。
疑似人流データは、以下にフローにあるように、大きく4つのステップで生成されています。
- 初期人口分布の生成(initial population):国勢調査をもとに、各種属性(年齢、性別、職業、世帯構成など)と建物に割り付けられた個人データが生成されています。
- 活動内容の推定(Activity transition):7つの目的(自宅、通勤、通学、買物、食事、病院、そのほか私事)の活動をどのような組み合わせで実施するかを、パーソントリップ調査から作成した確率モデルを用いて推定されています。
- 活動場所の選定(Location choice):通勤に関しては、国勢調査のODをもとに自治体レベルの勤務先を決め、それをさらにメッシュレベル・建物レベルに割り当てられています。買物、食事などの私事系の目的に関しては、パーソントリップ調査から推定した多項ロジットモデル(MNL)を用いて、活動場所が推定されています。
- 交通手段選択と軌跡データの生成(Transportation mode choice):交通手段は全国パーソントリップ調査を活用し、属性や活動目的、移動距離をもとに決められています。さらに道路ネットワークを用いて、1分未満の間隔の軌跡データが生成されています。
上記の方法で生成されたデータから、各個人の疑似人流データ及び時間帯別メッシュ(500m)人口分布、時間帯別リンク交通量のデータが提供されています。
REPLICA
REPLICA社では、シミュレーションで生成したトリップデータ等とともに、分析・予測ツールをセットで提供する商用サービスを展開しています。
トリップデータから交通に関する分析が行えるだけでなく、交通以外の分析もできるように以下のようなデータが提供されています。
- トリップデータ
- ネットワーク交通量データ
- 土地利用データ(区画毎の土地利用や建物数など)
- 消費データ
例えばトリップデータでは、以下のように1レコードが1トリップで交通手段や目的、出発時刻・到着時刻、出発地と到着地の緯度経度等の情報が付与されたデータが提供されています。
また、データと一緒にシナリオ分析可能なツールも提供されており、人口増加や雇用増加、リモートワークの進展等の分析を通じて、誰でもシナリオプランニングが実現できるようなサービスとなっています。
今後は、道路網の変更、公共交通ネットワークの変化、土地利用の変化等のシナリオも分析可能にしていくとのことです。
StreetLight
StreetLight社では、GPSや車両、携帯電話データをもとに、道路、歩行者、公共交通機関の交通量等のデータを生成し、商用サービスとして提供しています。
具体的には以下のようなデータが、提供されています。
- 交通量:AADT(Annual average daily traffic: 年間日交通量)や月別や時間帯別の交通量(田舎同を含むほぼすべての道路区間で、車種別の推計値も)
- OD分析:通常のOD分析に加え、特定のリンクを通過するODの表示、特定のODが通過するリンクの表示なども
- 交差点交通量(15分単位)
上記はツール化されており、クリックするだけで簡単に分析ができるようになっています。
また、センサーや世帯交通調査、国勢調査などの外部ソースに対して、精度を検証しており、その手法や検証結果がホームページ上で公表されていることも特徴です。
コストに関しても言及があり、交通量を100か所で把握するためカウンターを設定すると約31,000ドルかかる所が、56%カットできると述べています。また、ODに関しては、10か所の道路間のODをBluetoothで調査する場合には約110,000ドルかかる所が、91%と大きくコストカットできると述べています。
GEOTRA
GEOTRA社は、日本の会社で、GEOTRAアクティビティデータという非集計トリップデータを、合成データ技術やActivity Based Modeling等の技術により生成しています。
また、Webダッシュボードを用いることで、分析および高度なビュジアライゼーションを誰でも簡単に実行することができるようにしています。
おわりに
この記事では、データフュージョンによる人流データの生成に関して紹介しました。
データフュージョンにより生成された人流データは、先にあげたようなメリットが多くありますが、留意点としては、推計されたデータであり実態が完全に把握できるわけではないという、データの精度面での課題があります。
ただし、国勢調査や観測できる交通量等に合わせて一定程度の検証は行われていること、そもそもデータが何もなかった所で分析できるようになること、といった点から多くの交通分析でも活用可能性がある有望なデータであると言えます。
今後、データの検証方法や利用方法等が確立されていくことで、より一層の活用がされることが期待されます。
コメント