研究で意識すべき「エンドポイントの型」とは？

臨床研究で評価したいものをエンドポイントと呼びます。エンドポイントは臨床的な背景によって決め方は違いますが、統計的な考え方や解析の方法は「エンドポイントの型」ごとに共通です。つまり「エンドポイントの型」を意識することで、研究の結果のまとめ方の大筋に迷うことはなくなるということです！

この記事では「エンドポイントの型」の特徴とその解析方法について説明します！

要約

エンドポイントの型を意識することで研究をまとめやすくなる
エンドポイントの型には「連続値型」と「カテゴリカル型」と「Time-event型」がある
エンドポイントの型ごとにデータの要約方法や検定方法が決まっている
エンドポイントは既存の研究から決めるべき！

エンドポイントの型と解析の方法-2群間の比較と回帰モデル

エンドポイントの型は大きく分けて3つの連続値型、カテゴリカル型、Time-to-event型という型に分けられます。これらの例と解析手法をまとめると下の表のようになります。

各解析の特徴やEZRでの解析方法は別記事でも紹介しますので、そちらを参照ください！

以下ではそれぞれの特徴を説明します！

連続値型

連続値型は1, 1.1, 1.01, …のように連続的にとる値の型のことです。代表的な例としては血液検査や生化学検査のような臨床検査値や年齢などです。

連続値型では絶対的な差が意味を持ちます。例えば年齢が60歳と65歳の人がいる場合と20歳と25歳の人がいる場合、どちらの絶対的な差は5歳で、5歳差と認識できる、ということになります。

少し分かりにくいので逆に絶対的な差が意味を持たない例を考えてみましょう。例えばがんの臨床病期にStage I, II, III, IVという区分があります。これらを数値とみなして絶対的な差を見てみると、Stage IとII、Stage IIIとIVの差はどちらも1ですが、同じ1の差と考えてもよいでしょうか？

このように連続値型は絶対的な差が意味をもつという特徴があります。そのため、要約方法として平均値や中央値といった要約指標が使われます。

カテゴリカル型

カテゴリカル型は0,1,2,…の離散的な数値をとったり、男性と女性のように決まった区分をとる型のことです。

カテゴリカル型はさらに2つの型に分けることができます。例えば、性別（男性と女性）はどちらが優れているか、のような順番付はできませんが、がんの臨床病期Stage I, II, III, IVにはI < II < III < IVの順に悪性度が高くなる順番がつけられています。このように特に順序性を持たず同列で評価される型を離散型、値に順序が存在する型を順序型と呼びます。

特徴として離散型、順序型共にその絶対的な差に意味がありません。例えば男性に1, 女性に0という番号をつけた時に、男性と女性の差を男性(1)-女性(0)=1として評価することはできません。そのため、平均や中央値で評価することは不適当であり、頻度やその割合を示すことが一般的です。

Time-to-envent型

Time-to-event型は「生存時間型」とも呼ばれ、ある特定時点から興味のあるイベントが発生するまでの期間を示す型です。Time-to-event型の特徴として、興味のあるイベントを観察できなかった状況（打ち切り）が存在します。例えば、疾患を発症してから死亡するまでの期間を知りたいという場合、死亡する前に転院などで死亡の状況を知ることができなくなる打ち切りという状況が起こり得ます。

そのため、Time-to-event型では単純に連続値型のように生存期間を平均値で評価したり、カテゴリカル型のように生存割合で評価することは妥当ではなく、生存時間解析という方法で解析されます（仮想例で分かりやすく説明したこちらを御覧いただけると理解が深まります！）。

なぜエンドポイントの型を意識する必要があるのか？

解析方法・症例数設計に影響する

エンドポイントの型は解析方法や症例数設計方法に影響します。例えば、上の表に示したように平均値または中央値を比較することを目的とした連続値型の解析では、平均値や中央値で要約して、群間比較にはt検定やウィルコクソン検定が用いられるのが一般的です。また研究に必要な症例数や検出力は検定方法に依存するため、どのように検定を行うかを決めれば症例数設計方法も決まってきます。

そのため、エンドポイントの型を決めることで研究の統計学的な部分の大筋が決めることができる、ということになります。

見たいものがちゃんと見れているかをデザインに落とし込むことができる

エンドポイントの型は治療効果をどのような形で要約したいか、どのような形で評価したいかということを意味しています。例えば、何かスコアの変化を評価して治療効果を見たいといっても、群間のスコアの絶対的な差を見たいのか（連続値型）、スコアが何点以下になった人の割合を見たいのか（カテゴリカル型）、スコアが何点以下になるまでの期間を見たいのか（Time-to-event型）、によってその評価方法は変わってきます。

そのため、研究を始める前にどのような治療効果に興味があって、それはどのエンドポイントの型なのか、を意識することは研究デザインを考えるためにも非常に重要になってきます。

どのようにエンドポイントの型を決めるのか？

ここまでエンドポイントの型とは何か？エンドポイントの型を意識する意義について説明してきました。最後にどのようにエンドポイントの型、引いてはエンドポイントを決めるべきかについて説明します。

エンドポイントを決める際に必要なのは「一般的に理解される指標であるか」という視点になります。そのため、これから行う研究と似ている既存の研究から引用する、ということが一番シンプルかつ説明力がある方法になります。というのも既存の研究で用いられたエンドポイントはすでに一般的に理解されている指標であり、論文Journalにも納得された指標であるということです。

逆に既存研究を無視した独自のエンドポイントを立てた場合はどうなるでしょうか？場合によっては「都合のいいエンドポイントを立てたのでは？」とか「本当に意味のあるエンドポイントなのか？」と疑義が発生することがあります（実際これまでJournalのpeer-reviewでいただいたことがあります）。そのため既存研究で用いられたエンドポイントがある場合はそれを用いることがよいでしょう。ただ全てが一般に理解されたエンドポイントであるわけではないので、研究前にはきちんと関連論文のレビューを行ってエンドポイントの意義等を整理しましょう！