医学研究ではある興味のあるイベントが発症するまでの時間を調べる研究が多くあります。このようなデータは生存時間データと呼ばれるデータで、生存時間データを解析するための手法があります。この記事では生存時間データを解析する方法を一挙に紹介します!
要約
- 生存時間データは興味のイベントが発生するまでの期間のデータ
- 生存時間データの解析には生存時間解析という特別な解析が必要
- カプランマイヤープロット、ログランク検定、Cox回帰が生存時間解析のゴールドスタンダード!
生存時間解析とは?
生存時間データとはある時点(起算日)から興味があるイベントが発生するまでの期間のデータのことを指します。例えば、臨床試験であれば登録日から死亡するまでの期間や観察研究ではカルテで分かる手術日から再発するまでの期間が生存時間データに該当します。
生存時間データの特徴としてイベントが観測できない状況(打ち切り)が発生します。そのため、生存時間データには臨床検査値のような連続値データや治療効果の有無のようなカテゴリカルデータとは異なる解析が必要になってきます。
例えば異なる治療をA群とB群に割りつけて、この2つの群の観察開始から死亡までの期間を比較して治療効果を評価する以下のような2つの研究を考えてみましょう。
生存期間(連続値データ)を比較する場合
A群とB群の平均生存期間はどちらも(1+2+3)/3 =2年になります。「つまり、A群もB群も治療効果は同じ!」と判断してもよいでしょうか?
A群は2名生存しているのに対してB群は1名のみ生存しており、生存割合はA群のほうが高くなっています。生存割合でみると「A群の方が治療効果がよかったのでは?」とも考えられるでしょう。
生存割合(カテゴリカルデータ)を比較する場合
A群とB群の生存割合を計算すると、どちらも2/3 =66.7%になります。こちらも「A群もB群も治療効果は同じ!」と判断してもよいでしょうか?
A群とB群の生存期間を比較すると、A群は(1+3+3)/3 = 2.33年、B群は(1+2+3)/3 = 2年でA群の方が長くなります。この結果であれば「A群の方がB群の方が治療効果が高い」と判断するでしょう。
このように生存時間を連続値データやカテゴリカルデータとして扱うと、その扱いによって判断が変わってくることになります。その原因が「打ち切り」がデータに含まれているからで、この「打ち切り」をうまく扱うための解析方法が「生存時間解析」になります!
生存時間解析で覚えておくべき基本的な解析方法は以下の3つです。以降ではこれらの手法についてご説明いたします!
生存時間の要約方法 – カプランマイヤープロット
生存時間の要約にはカプランマイヤープロットを使うことが一般的です。カプランマイヤープロットは生存曲線を推定する方法で、以下のようなグラフで描くことができます。
その見方として押さえておくべき点は3点です。
- 縦軸に生存割合、横軸に起算日からの時間をとる
- イベント発生したら階段が落ちる
- 打ち切りが発生したら「ひげ」を立てる
カプランマイヤープロットを使うことで生存時間解析で代表的な要約指標である「生存期間中央値」と「年次生存割合」が分かります!
生存期間中央値(Median survival time; MST)は全体の50%の人がイベントを起こした時点で、縦軸が50%のところから横に垂線を引いて、カプランマイヤープロットと交わる時点です。
また年次生存割合(yearly survival rate)はある時点の生存割合であり、例えば、1年時点の生存割合を知りたければ、横軸が1年時点から縦に垂線を引いてカプランマイヤープロットと交わった割合が1年生存割合になります。
ログランク検定
群間比較を行う際にはログランク検定が用いられます。ログランク検定はイベントが発生した順番で群間比較を行う方法です。つまりログランク検定を解釈する上で注意すべき点は「1時点の生存割合を比較している」のではなく、「生存曲線全体を比較している」という点です。つまり、ログランク検定で有意差があった場合、「生存曲線全体に違いがある」と判断することになります。
ログランク検定のほかにもウィルコクソン検定という群間比較方法もあります。それらの違いは記事にしますのでお待ちください!
Cox回帰モデル
どの程度治療効果が異なるかを調べるためにはCox回帰モデル(別名:Coxの比例ハザードモデル)が用いられます。Cox回帰モデルを用いることで治療効果をハザード比(hazard ratio)で要約することができます。
ハザードとは?
ハザードとは「その瞬間に死亡する人数」のことです。
少し分かりにくい概念なのですが、車のスピードメーターを考えてもらうと分かりやすいかもしれません。車のスピードメーターは60km/hなど「1時間あたりにどれだけ進むか」を示しています。ただスピードメータは1時間単位でなくとも1分、1秒、さらには1msでどれだけ進むか、を示すこともできます。
これと同様にハザードも「1年で何人が死亡するか」の「1年」を、1カ月、1日、…、1秒というように細かい単位に変えていくことで、「極短い間に何人が死亡するか」という数字としてみることができます。この「極短い間に何人が死亡するか」がハザードと呼ばれるものです!
そのためハザードが大きいということは「短い間に死亡する人数が多い」ということになり、ハザードが小さいほど「予後がよい」と判断することができます。ハザード比はその比なのでA群のB群に対するハザード比(A群のハザード/B群のハザード)であれば、ハザード比が1に近いほど治療効果に違いがなく、ハザード比が小さいほどA群の方が治療効果が高い、ということになります。
まとめ
今回は生存時間解析で使われる基本的な解析手法3つを紹介しました!
生存時間解析は頻用される解析でもあるので、この機会に理解しましょう!
コメント