【臨床試験のデザイン】優越性試験、非劣性試験、同等性試験の違いと考え方を解説！

臨床研究の中でも新しい治療法の有効性を検証する研究のことを臨床試験と呼びます。

臨床試験では優越性試験、非劣性試験、同等性試験という試験デザインがあります。優越性試験、非劣性試験、同等性試験はそれぞれ特徴があり、適応される状況もことなります。

今回は優越性試験、非劣性試験、同等性試験とは何なのか？どのように試験デザインを決定するか？について解説します！

この記事のpoint！

優越性試験は「対照群に対して試験群が優れていること」を検証する試験デザイン
非劣性試験は「対照群に対して試験群が劣らないこと」を検証する試験デザイン
同等性試験は「対照群に対して試験群が同等であること」を検証する試験デザイン
優越性試験、非劣性試験、同等性試験は治療の患者のリスクベネフィットから選択する

臨床試験とは？

臨床試験の定義

まず初めに前提となる臨床研究と臨床試験を見ていきましょう。

臨床研究は人を対象とした全ての医学研究を指し、その中でも臨床試験は人を対象に新しい薬や治療法の効果を評価する研究のことを指します。

そのため、多くの研究は臨床研究に該当するものの、臨床試験に該当しない研究です。

よく臨床研究と臨床試験を混同して使用している人がいるのでしっかりと区別しましょう！

臨床試験実施の注意点

臨床試験には様々なデザインタイプがあります。

臨床試験デザインを考えるときに注意すべき点は以下です。

ランダム化：対象を治療群ごとにランダムに割り付ける
盲検化：研究者または対象者に割り付けられた治療群が分からないようにする
優越性/非劣性/同等性：どのように評価すれば対照群に対して試験群が優れていることを示せるか

今回は3つ目の「どのように評価すれば対照群に対して試験群が優れていることを示せるか」について解説します！

代表的な3つの臨床試験デザイン

代表的な試験デザインは優越性試験、非劣性試験、同等性試験があります。これらは「対照群に対して試験群がどうなれば優れてると判断するか」の違いがあります。

この「どうなれば優れているのか」はプライマリーエンドポイントと呼ばれる、臨床試験で最も注目して評価したい指標によって判断されます。

つまり、適切に試験デザインを選択することによって、このプライマリーエンドポイントがどうなれば試験群の方が優れているか、を決めることができます！

以下では優越性試験、非劣性試験、同等性試験の違いを見ていきましょう！

優越性試験

優越性試験は「対照群の治療効果に対して試験群の治療効果が優れているか＝優越性」を示すことを目的とした臨床試験デザインです。つまり、対照群の治療効果 < 試験群の治療効果であることを統計学的に検証していきます。

多くの場合、優越性試験では検定を用いて優越性があるかを判断します。

例えば、帰無仮説「対照群の治療効果＝試験群の治療効果」、対立仮説「対照群の治療効果 < 試験群の治療効果」としてプライマリーエンドポイントに合う検定方法で評価します。もし有意水準0.05としたら、プライマリーエンドポイントに対する検定のp値が0.05を下回れば、「対照群の治療効果 < 試験群の治療効果」として優越性が示せたことになります。

非劣性試験

非劣性試験は「対照群の治療効果に対して試験群の治療効果が劣っていないか＝非劣性性」を示すことを目的とした臨床試験デザインです。

非劣性試験では非劣性マージンと呼ばれる「これ以上劣っていない場合に非劣性と判断する基準」と治療効果の信頼区間を比較して非劣性かどうかを評価します。

もし治療効果の差の信頼区間の下限がこの非劣性マージンを下回っていなければ、非劣性が示されたと判断します。

非劣性マージンの決め方

非劣性マージンをどの程度にするかはよく議論になる点です。

統計学的に決められないか、と相談いただくことがありますが、非劣性マージンは臨床的な観点から決める必要があります。

非劣性マージンを決めるポイントは「試験治療によって軽減されるリスクに対して、どの程度劣っていることが許容できるか」。

つまり、リスクベネフィットの観点から決定する必要があるため、臨床的に決める必要があります。

同等性試験

同等性試験は「対照群の治療効果に対して試験群の治療効果が同等であるか＝同等性」を示すことを目的とした試験デザインです。

優越性試験と非劣性試験とは異なり、対照群に勝っても負けてもいけない試験デザインです。

同等性試験は同等性マージンと呼ばれる「この程度であれば治療効果と同等だろう」と考えられる基準と信頼区間の上限と下限を比較して、同等性を評価します。

もし同等性マージンの下限を-δ、上限をδとしたときに、「信頼区間の下限が-δ以上、かつ、信頼区間の上限がδ以下」である時に同等性が示されます。

注意してほしいのは「信頼区間の下限が-δ以下」でも「信頼区間の上限がδ以上」でも同等性を示せないこと。

「信頼区間の上限がδ以上だから同等性以上に優越性が示せた！」と判断している研究もありますが、これは全く間違った解釈なので注意しましょう！

優越性試験、非劣性試験、同等性試験の結果は信頼区間で解説！

優越性試験、非劣性試験、同等性試験の結果は検定の他、信頼区間からも判断することができます。
ポイントは「信頼区間の下限、上限が事前に定めた基準をまたぐか否か」です。

簡単化のために判断に使用する信頼区間は両側95%信頼区間として考えてみましょう。
また非劣性マージンはδ、同等性マージンは±δとしています。

どのように臨床試験デザインを選べばよいか？

優越性試験と非劣性試験の選び方

臨床試験のデザインを選ぶ上で最も悩むのが、優越性試験か非劣性試験かという点です。

優越性試験か非劣性試験かを決めるポイントは対照群と試験群のリスクベネフィットの観点です。つまりは、「患者負担や治療の手間（リスク）と比較して、十分な治療効果（ベネフィット）が得られているか」という観点です。

例えば、対照群の治療Aと試験群の治療A+Bを比較する試験を考えてみましょう。

このとき、試験群では治療Bを上乗せしているので、有害事象が増えたり、治療の手間が増えたりとリスクが増えることになります。

もし治療Aと治療A+Bの治療効果が変わらなければ、治療Aと治療A+Bのどちらを使いたいとなるでしょうか？

もちろん治療Aの方だと思います！

なので、治療が上乗せされるなどで患者負担のようなリスクが増える場合は治療効果が向上する必要があり、優越性試験を選択することになります！

非劣性試験はその逆で、治療が省略されるなどリスクが減っても治療効果が劣らないことを確認したい場合には非劣性試験が選択されます。

同等性試験は状況が限られる！？

同等性試験は優越性試験や非劣性試験と異なり限られた状況で使用されます。

というのも、優越性試験と非劣性試験は患者のリスクベネフィットの観点から選択されることを考えるとよくわかります。

このリスクベネフィットの観点から判断すると、同等性試験は「試験群の治療が対照群の治療と患者のリスクも治療効果も同等」と考えられる治療を比較することになります。

（少し厳しい言い方になりますが）そのような治療法を新しく開発する必要はあるでしょうか？試験群の治療に置き換えるメリットは何でしょうか？

そのため、臨床試験において比較される治療法はリスクベネフィットでバランスが異なる必要があります。

では同等性試験はどのような状況で使用されるのでしょうか？

同等性試験が使用されるのはジェネリック医薬品のような後発医薬品の開発です。

後発医薬品は先発医薬品と同じ有効成分を含む医薬品です。ただ開発費が先発医薬品に比べてかからないため、先発医薬品よりも安く販売されます。

この後発医薬品は先発医薬品と同等の治療効果を有することを確認する必要があるため、同等性試験が行われます。

（もし後発医薬品が先発医薬品よりも効果があってもなくても、同じ有効成分かあやしいですからね…）

まとめ

今回は臨床試験の代表的なデザインである優越性試験、非劣性試験、同等性試験の3つについて解説しました。

それぞれのデザインが使用できる状況は異なるので、どの状況に該当するか考えてデザインを選択しましょう！

各試験デザインが選択される代表的な状況

優越性試験：対照群のリスク < 試験群のリスクの場合

非劣性試験：対照群のリスク > 試験群のリスクの場合

同等性試験：後発医薬品の開発