主要評価項目
主要評価項目(しゅようひょうかこうもく、Primary endpoint,ラテン語: primus=「最初の」)は、臨床試験において達成を目指す主要目的であり、その結果は臨床試験のプロトコルに基づいて評価された普遍的な結果である[1]。主要評価項目は、使用された介入(一般的には医療行為)が成功したか否かを判断するために使用される。例えば、生存率や再燃(再発)のリスクを主要評価項目として定義することができる。この研究では、これらの基準を治療群と対照群で比較する。主要評価項目は、試験開始前に定義されている必要がある。主要評価項目が達成されたかどうかで、試験の成否が決まる。
O'Neillは、主要評価項目を次のように定義している。
“a clinical endpoint that provides evidence sufficient to fully characterize clinically the effect of a treatment in a manner that would support a regulatory claim for the treatment.”
『主要評価項目は治療法の効果を臨床的に完全に特徴づけるのに充分な証拠を提供するもので、その治療法に関する規制上の主張を裏付けるものである。』—R. T. O’Neill、Secondary endpoints cannot be validly analyzed if the primary endpoint does not demonstrate clear statistical significance.[2]
主要評価項目の決定
[編集]臨床試験を開始する前(a priori )に、試験の主目的である「主要評価項目」が定義される[3][4]。可能な限り「ハード」な評価項目、つまり測定可能で明確に定義された基準を設けることが重要である。ハードな評価項目とは、例えば
などである。
生活の質[5]や痛み[5]などの「ソフト」な評価項目は定量化できない。これらは、非常に限られた範囲でしか主要評価項目として定義することができない。副次評価項目に含まれる可能性がある。
試験の主要評価項目は、承認機関(PMDAなど)とともに定義することができる[6]。
代替評価項目
[編集]代替評価項目(代替マーカー)とは、主要目的が測定不可能な場合に代わりに測定される検査項目のことである。例としては、白血球数、血圧、骨密度などが該当する。1つまたは複数の代替評価項目の値を測定可能な主要評価項目として選択することも可能である。しかし、これらは治療的介入の臨床的な有益性や有害性を直接測定するものではない。過去には、代替評価項目を用いた研究で、致命的に間違った結論を導き出したものがいくつかあり、そのうちのいくつかは後に治療を受けた患者に多大な悪影響を及ぼした。薬力学的効果は、治療効果を証明するものではない[1]。
相関関係があると一部で言われている代替評価項目の例を以下に示す。
主要評価項目として不適切な代替評価項目の例としては、肺癌予防のために喫煙者にβ-カロテンを投与することが挙げられる。主要評価項目(落ち込んだビタミン濃度の上昇)は達成されたが、投与により肺癌死亡率の上昇も見られた[7]。
複数の主要評価項目
[編集]主要評価項目として複数の臨床事象を取り扱う場合、複合評価項目を形成する方法と、複数の主要評価項目に統計的評価閾値(有意水準)を振り分ける方法がある。
複合評価項目
[編集]有意水準の振り分け
[編集]通常臨床試験では、有意水準を5%とし、主要評価項目の検定結果がp<0.05であった場合に「主要評価項目は5%水準で有意である」という。主要評価項目を単純に複数個設けた場合、何方かの検定結果がp<0.05となる確率は9.75%となり、妥当性を欠く。このような場合、ボンフェローニ補正やシダック補正を用いて何方かの検定結果がp<0.05となる確率を5%に抑えると、統計学的に妥当な結果を導くことができる。このような場合、それぞれの評価項目に均等に有意水準を割り振るだけでなく、1%と4%など、不均等に割り振ることも可能である[8]。
他の評価項目
[編集]主要評価項目に加えて、通常は1つ以上の副次評価項目も設定される。時には、三次評価項目も設定されることもある[9]。介入によって起こり得る副作用については、患者を守るために安全性の評価項目も設定される[1]。また、複合評価項目とは、いくつかの個別の基準を組み合わせたもので、仮説を確認するためにはそのうちの1つ以上が達成されなければならない。
主要評価項目の例
[編集]再発・難治性のB細胞性慢性リンパ性白血病(B-CLL)の治療に関する試験で、主要評価項目は、治療に対する患者の反応(寛解率)であった。副次評価項目は、無増悪生存期間、全生存期間、治療に対する忍容性と安全性であった[10]。
ASCOT試験では、高血圧患者を対象に、ACE阻害薬のペリンドプリルとカルシウム拮抗薬のアムロジピンの予防効果を検討した。主要評価項目は、「非致死性心筋梗塞および致死性冠動脈疾患」であった。副次評価項目には、「全ての死因による死亡率、心血管死亡率、致死性および非致死性の脳卒中、すべての心血管イベントと介入」が含まれていた。三次評価項目は「新たな糖尿病の発現」であった[11]。
出典
[編集]- ^ a b c d e M. Wolbers: Statistische Methoden in der klinischen Forschung (Memento vom 4. 3月 2016 im Internet Archive) (PDF). Basler Institut für klinische Epidemiologie, Universität Zürich, 2007, S. 33.
- ^ R. T. O’Neill: Secondary endpoints cannot be validly analyzed if the primary endpoint does not demonstrate clear statistical significance. In: Contr. Clin. Trials. 18/1997, S. 550–556, doi:10.1016/S0197-2456(97)00075-5.
- ^ National Cancer Institute: Dictionary of Cancer Terms: primary endpoint, abgerufen am 4. Dezember 2007.
- ^ A. Diekmann: Methoden der Sozialforschung. 2006, ISBN 3-531-14362-X, S. 74.
- ^ a b c d K. Lechner: Anforderungen an die Informatik bei der Entwicklung neuer Medikamente (PDF; 1,0 MB). Medizinische Universität Wien.
- ^ Serono gibt hoch signifikante positive Ergebnisse der Vergleichsstudie von Rebif® mit Avonex® bei multipler Sklerose bekannt, auf: chemie.de, 10. Mai 2001.
- ^ M. Berger, I. Mühlhauser: Arzneimittelsicherheit: Wirksamkeit von Medikamenten muss auch nach Zulassung geprüft werden. In: Deutsches Ärzteblatt. 97, Ausgabe 4/2000, S. A-154. (aus New Engl J Med. 330, 1994, S. 1029 und 1996; 334, S. 1150)
- ^ O'Shaughnessy, Joyce; Schwartzberg, Lee; Danso, Michael A.; Miller, Kathy D.; Rugo, Hope S.; Neubauer, Marcus; Robert, Nicholas; Hellerstedt, Beth et al. (2014-12-01). “Phase III Study of Iniparib Plus Gemcitabine and Carboplatin Versus Gemcitabine and Carboplatin in Patients With Metastatic Triple-Negative Breast Cancer”. Journal of Clinical Oncology 32 (34): 3840–3847. doi:10.1200/JCO.2014.55.2984. ISSN 0732-183X .
- ^ “Die ASCOT-BPLA-Studienergebnisse: Ein grosser Schritt vorwärts in der…”. archive.ph (2013年1月16日). 2021年12月6日閲覧。
- ^ "CLL2K Protokoll-Synopse" (PDF). Deutsche CLL Studiengruppe. 2021年5月28日閲覧。
- ^ “Die ASCOT-BPLA-Studienergebnisse: Ein grosser Schritt vorwärts in der…”. archive.ph (2013年1月16日). 2021年12月6日閲覧。
関連文献
[編集]- G. Y. H. Chi (1 October 1998), "Multiple testings: Multiple comparsions and multiple endpoints", Drug Information Journal (ドイツ語), doi:10.1177/00928615980320S131。
- Über Risikofaktoren und Endpunkte. In: Erfolgreich wissenschaftlich arbeiten in der Klinik. 2., überarbeitete und erweiterte Auflage. Verlag Springer, Vienna 2005, ISBN 3-211-21255-8, S. 13–22.