都市交通と生存時間モデル

都市交通の分野でデータ活用について検討していると、生存時間モデルという分析手法を提案されることや生存時間モデルでの分析結果を提示されることがあると思います。

生存時間モデルは様々な分野で活用される手法で、都市交通の分野においてもいくつかの場面で代表的な手法として使用されています。

本記事では、生存時間モデルの名前を初めて聞いた人から聞いたことがある人を対象に

  • 何のために行うのか
  • 何に気を付けた方がよいのか
  • 都市交通では、どんな場面で使われるのか

という点について解説していきます。

生存時間モデルとは

生存時間モデルとは

生存時間モデルとは、イベントが起きるまでの時間を分析する手法です。具体的に代表的な分析を挙げると、製造業において機械の故障をイベントとしてその故障時間を分析することや、医学分野において死亡をイベントとしてある病気での死亡までの時間を分析することがあげられます。生存時間モデルでは、イベントが起きるまでの時間を目的変数として、イベントが起きるまでの時間を説明する変数を説明変数と呼びます。

交通の分野においては、1日のアクティビティにおける、ある地点の滞在時間の分析の場面で代表的に活用される分析手法です。

生存時間モデルの目的

生存時間モデルを用いて、イベントが起きるまでの時間をモデル化することは、大きく2つの目的があります。

目的1:目的変数と説明変数の関係性を分析する

関係性の分析をすることで、目的変数の変化と説明変数の変化の関係性を把握します。
例えば、滞在時間の例では、

  • イベントが始まった時間と滞在時間との関係性
  • 性年齢等、行動を行う人の属性と滞在時間との関係性

等について把握することを目的とします。これによって、例えば中心市街地の滞在時間を増加させる等の目的に対して、どのような施策が有効かということについて検討を行います。

目的2:目的変数の予測をする

生存時間モデルで推定した関係性をもとに、目的変数の予測つまりイベント発生までの時間の推定を行います。例えば滞在時間の例では、1日の個人の行動を予測するシミュレーションの中で、ある地点に滞在する滞在時間を推定するモデルに活用するということが考えられます。

結果の見方

生存時間モデルの種類

生存時間モデルは、以下の図に示すように様々な種類があります。一方で、交通の分野で活用されるものの多くはこの中ででもsemi-parametricのモデルかparametricのモデルになります。そこで、ここではこれら2つのモデルを見るときの解釈と注意点を整理したいと思います。

推定結果の見方

上記で整理したように生存時間モデルには様々な種類があるので、モデルによって若干の際はありますが推定結果は概ね以下の表のような形で示されます。
この時見るべきポイントは大きく二つで、パラメータと有意水準です。パラメータについては、符号がプラスであればその変数が大きければ大きいほど生存時間が長くなると解釈でき、マイナスであればその変数が大きければ大きいほど生存時間が短くなると解釈できます。有意水準については、一般的に5%や1%で統計的に有意であると設定することが多く、これによってその変数が有効かどうかを判定します。この有意水準をどのラインに設定するかは、各分析でそれぞれ事前設定を行います。

結果を見るときの注意点

説明変数の符号の理論的な整合性

結果を見るときにまずに確認したいことは、説明変数の符号についての理論的な整合です。例えば死亡までの時間の推定モデルでは、若い人であればあるほど死亡までの時間は長くなると考えられます。このように説明変数の符号に理論的に整合性があるかは、前提条件として確認します。

相関関係であり因果関係ではない

生存時間モデルで推計されるものは、あくまで相関関係であり因果関係です。
つまり、例えば到着時間が早い時間であるほど滞在時間が長くなるという傾向が分析結果として算出された場合にそれらに相関関係はありますが、到着時間が早くなった場合に滞在時間が長くなるという因果関係を示しているわけではありません。このことに注意をしつつ、あくまでそのような傾向にあるということ示す結果であることを理解したうえで、節度を持って結果を解釈する必要があります。

コメント

タイトルとURLをコピーしました