Essais de non-infériorité dans la maladie thromboembolique veineuse. Une lecture critique est nécessaire!

L. Pérard,A. Hot,Michel Cucherat,Martha N Simon,H. Desmurs,B. Coppéré,M.-H. Girard-Madoux,J.-P. Boissel,J. Ninet

La Revue de Médecine Interne（2007）

引用 4|浏览16

暂无评分

摘要

Résultats Nous avons trouvé neuf essais de non-infériorité portant sur la maladie thromboembolique veineuse. La perte d'efficacité maximale tolérée était en moyenne de 434 % avec une médiane à 357 %. Pour 85 % des valeurs, la perte d'efficacité consentie est supérieure à 100 %. Discussion Les trois quarts des essais de non-infériorité dans la maladie thromboembolique concluent à l'équivalence alors qu'il existe une perte d'efficacité potentielle de la totalité de l'effet du traitement standard par rapport au placebo. Les résultats des essais de non-infériorité doivent donc être interprétés avec prudence. Le choix du seuil de non-infériorité doit être plus rigoureux et être positionné par rapport à l'efficacité minimale démontrée du traitement de référence. Abstract Introduction Equivalence trials are actually frequently used to prove non-inferiority in anticoagulant therapy. Equivalence trials consist to demonstrate that two treatments are not too much different. This difference has to be under a margin previously determined. The margin corresponds to an efficacy loss that is defined to be acceptable, in accordance to the advantages due to the new treatment. The aim of this work is to explore the equivalence trial published in the thromboembolic disease by focus on the non-inferiority margin used. Methods We identified published equivalence trials in the venous thromboembolic disease, by a systematic search in Medline. We calculated the efficacy loss by reference with the value of the smallest effect size of the standard treatment compared to placebo. Results We found 9 equivalence trials used in venous thromboembolic disease. The mean value of the efficacy loss was 434%, and the median value was 357%. Eighty-five percent of the values of the efficacy loss were above 100%. Discussion Eighty-five percent of the equivalence trials conclude to equivalence despite a complete efficacy loss of the effect of the standard treatment compared to placebo. The results of equivalence trials should be interpreted warily. The corresponding non-inferiority margin should be chosen more rigorously and by reference with the value of the smallest effect size of the standard treatment compared to placebo. Mots clés Essais cliniques Thromboses veineuses Équivalence thérapeutique Keywords Clinical trials Venous thrombosis Therapeutic equivalency 1 Introduction Depuis plusieurs années, l'utilisation des essais de non-infériorité est de plus en plus fréquente dans la validation de nombreux traitements et en particulier des anticoagulants. Sur le plan statistique, il est impossible de démontrer que deux traitements sont strictement équivalents [1] . Cet obstacle est contourné par la recherche d'une équivalence relative, qui consiste à montrer que deux traitements ne sont pas trop différents, et que cette différence reste inférieure à un seuil préalablement fixé, dit de non-infériorité [2–4] . Ce seuil correspond à la quantité d'efficacité que l'on peut consentir à perdre, étant donné les autres avantages du nouveau traitement (plus grande facilité d'utilisation, meilleure tolérance ou plus faible coût) [5,6] . L'essai de non-infériorité est extrêmement sensible à sa qualité méthodologique. La problématique principale est la définition de ce seuil de non-infériorité (SNI) en deçà duquel le résultat de l'étude sera considéré comme « équivalent ». Plus précisément, la décision de non-infériorité s'effectuera en comparant la borne supérieure de l'intervalle de confiance (du résultat de l'étude) avec le SNI choisi. Si cette borne est inférieure à ce seuil, il est possible de conclure à la non-infériorité avec un risque d'erreur contrôlé [3,4] . En revanche, si la borne supérieure de l'intervalle de confiance est supérieure au SNI, il n'est pas possible d'exclure que le nouveau traitement soit moins efficace que le traitement de référence. ( Fig. 1 ). La signification du seuil de non-infériorité est importante. Il correspond à la plus grande perte d'efficacité par rapport au traitement de référence que l'on consent. Par exemple, un seuil relatif de 10 % signifie que l'on considérera le nouveau traitement comme « équivalent » (non inférieur) tant que son efficacité ne sera pas inférieure, en relatif, de 10 % à celle du traitement de référence. Au maximum, le nouveau traitement, déclaré comme « équivalent », pourra entraîner une augmentation relative de la survenue du critère de jugement (par exemple la récidive thrombotique) de 10 %. L'essai de non-infériorité ne démontre donc pas stricto sensu l'équivalence, car il est possible que le nouveau traitement soit moins efficace que le traitement de référence. Pour limiter la perte d'efficacité, le seuil devrait être inférieur à l'efficacité minimum démontrée du traitement de référence [3,7,8] . Le nouveau traitement doit prouver que cette efficacité minimum conservée doit être supérieure à zéro [9] . Plus récemment, la FDA a exprimé son souhait de diminuer le seuil en dessous de 10 % de cette efficacité minimum démontrée par le traitement de référence contre placebo [10] . Il semblait donc intéressant de rechercher dans les publications médicales l'ensemble des essais de non-infériorité afin d'étudier comment les différents auteurs appréhendent le SNI, en se focalisant particulièrement sur son positionnement par rapport à l'efficacité du traitement de référence. L'objectif de ce travail est donc l'analyse descriptive des seuils de non-infériorité en termes de perte d'efficacité consentie, c'est-à-dire de l'efficacité minimum préservée. 2 Matériel et méthode Nous avons donc recherché les essais de non-infériorité publiés dans des revues internationales. Nous nous sommes servi du moteur de recherche Internet PubMed (National Library of Medecine, www.ncbi.nlm.nih.gov ) entre 1979 (date de publication du premier essai de non-infériorité) et le 1 er juillet 2004, en utilisant les mots clés : equivalence trial , non-inferiority , equivalence , equivalent efficacy , equally effective , equivalent efficacy , equally effective et equivalent . Les caractéristiques méthodologiques de chacun des essais ont été répertoriées dont le seuil de non-infériorité, ainsi que sa justification par les auteurs. L'analyse des données a compris : ● la perte d'efficacité consentie par les auteurs en positionnant le SNI ; ● la perte d'efficacité par rapport à la borne la plus péjorative de l'intervalle de confiance. Cela a permis de déterminer la perte d'efficacité maximale possible tolérée par le SNI. Ce résultat est considéré comme la valeur principale de notre étude. Pour illustrer ces différentes analyses, prenons l'exemple de l'étude MATISSE-EP [11] . Cette étude avait pour but de comparer un nouvel anticoagulant, le fondaparinux, au traitement de référence de l'embolie pulmonaire, l'héparine non fractionnée (HNF). Le critère de jugement principal était la survenue d'une récidive thromboembolique. Les auteurs présumaient que les deux traitements étaient équivalents. Ils se sont donc basés sur l'efficacité de l'HNF dans le traitement des thromboses veineuses profondes proximales par rapport à l'absence de traitement héparinique, pour déterminer le seuil au-delà duquel les deux traitements ne seraient plus équivalents. Cette première étude avait, selon les auteurs, démontré que l'utilisation d'HNF (par rapport à l'absence de thérapeutique) diminuait le risque de récidive thromboembolique de 15 %, soit un taux de nouvelles thromboses sous HNF de 5 contre 20 % sans traitement [12] . Le SNI a été positionné à 3,5 %. C'est-à-dire que les auteurs ont estimé que si la différence de survenue de thromboses entre les deux traitements (fondaparinux et HNF) n'excédait pas 3,5 %, ils pouvaient être considérés comme équivalents. L'efficacité du traitement de référence (HNF) étant une diminution de 15 % des récidives thromboemboliques et le SNI étant de 3,5 %, la perte d'efficacité du fondaparinux tolérée ou consentie par les auteurs (PEC) représente en fait 3,5/15, soit 23,34 % de l'efficacité du traitement par HNF par rapport au placebo ( Fig. 2 ). Si l'on se réfère à l'article de référence qui a démontré l'efficacité des HNF [12] , il est obtenu une diminution du risque de thrombose de 13,3 % avec un intervalle de confiance à 95 % de [–25 % ; –1,4 %]. C'est-à-dire qu'on ne peut pas exclure que les HNF ne diminuent le risque de thrombose que de 1,4 % par rapport à l'absence de traitement. C'est l'efficacité minimale démontrée. Si l'on considère le seuil de non-infériorité par rapport à cette efficacité minimale démontrée, la perte d'efficacité (PEMD) du fondaparinux correspond alors à 1,4/3,5 soit 250 % ( Fig. 3 ). La PEMD sera la valeur principale de notre étude, car elle prend en compte l'efficacité minimale démontrée des traitements de référence comme cela est recommandé [3,7,8] . Dans la plupart des essais, le SNI était décrit en termes de bénéfice absolu. Le bénéfice absolu reflète plus les conséquences apportées par un traitement au niveau d'une population. Le risque relatif est le reflet direct de l'efficacité du traitement. Il est en général constant d'une population à l'autre. De ce fait le SNI exprimé en risque relatif est, dans le cadre de notre étude, le meilleur indice d'efficacité puisque qu'il ne dépend pas des événements dans le groupe de référence. 3 Résultats Nous avons retrouvé, jusqu'au 1 er juillet 2004, huit essais thérapeutiques de non-infériorité portant sur la maladie thromboembolique veineuse [11,13–20] . Sur ces huit essais publiés, l'un d'entre eux a utilisé deux seuils de non-infériorité au cours de deux comparaisons [13] , soit au total neuf SNI exploitables. Ces essais ont été publiés dans quatre revues différentes dont le facteur d'impact (année 2004) variait de 4,9 à 29,6. L'année de publication allait de 1996 à 2004. Toutes les études étaient randomisées et en double insu. Le seuil de non-infériorité a été recensé dans chacun des articles. La PEMD a pu être calculée dans 77 % des cas (7/9 cas). Elle n'a pas pu être calculée dans deux études : l'étude DOTAVK [17] et l'étude MATISSE-TVP [19] . Dans l'étude DOTAVK, le doppler veineux était utilisé afin de détecter les récidives thromboemboliques, alors que la phlébographie avait été utilisée pour valider le traitement de référence. Ces méthodes de détection n'étant pas les mêmes, il n'y avait pas de comparabilité possible des critères de jugement et le calcul était de ce fait non réalisable. Toutefois, la PEC a pu être calculée puisque les auteurs avaient justifié leur positionnement du SNI. Dans l'étude MATISSE-TVP, les auteurs se sont référés à une méta-analyse comparant HNF et HBPM pour justifier l'efficacité des HBPM. Cette méta-analyse n'avait pas permis de montrer la supériorité des HBPM par rapport aux HNF sur le critère des récidives thromboemboliques. Il était alors impossible d'utiliser ce résultat pour calculer une perte d'efficacité alors que la supériorité n'était pas démontrée. La valeur principale de notre étude est la perte d'efficacité selon l'efficacité minimale démontrée (PEMD). Elle était en moyenne de 434 % avec une médiane à 357 % et des valeurs extrêmes allant de 80 à 714 %. La PEC était en moyenne de 53 %, avec une médiane à 45 %. Les pertes d'efficacité pour chacune des études sont rapportées dans le Tableau 1 . De plus, 85 % (6/7) des valeurs de la PEMD étaient supérieures à 100. Cette valeur représente la situation où il est accepté de perdre la totalité de l'efficacité du traitement de référence. La répartition de ces valeurs est retranscrite sous forme de box plot ( Fig. 4 ). La justification du positionnement du seuil est apportée pour l'ensemble des essais. Toutefois, elle n'est pas satisfaisante dans deux essais [13,15] . Les auteurs se réfèrent aux recommandations méthodologiques faites dans la littérature [21] mais ne justifient pas la valeur de leur seuil. Les autres essais de notre série ne tenaient pas compte de la perte d'efficacité du traitement de référence. Au niveau des caractéristiques méthodologiques, le risque alpha moyen utilisé par l'ensemble des auteurs est de 0,048 (écart-type : 0,009), la puissance 1-β moyenne utilisée est de 0,83 (écart-type : 0,064), le nombre moyen de patients inclus est de 1024 (écart-type : 568), le nombre de patients analysés est identique, une analyse intermédiaire n'a été effectuée dans aucun des cas, la randomisation était précisée dans 100 % des articles. Pour 6/9 essais l'analyse était de type per protocole (PP) puis en intention de traiter (ITT). Une étude ne précisait pas le type d'analyse et les deux autres étaient en ITT uniquement [15,20] . Le critère de jugement principal était la récurrence des thromboses dans toutes les études. La conclusion des essais était l'équivalence dans 100 % des cas. Enfin, le financement de ces essais était réalisé pour 7/8 des essais par des laboratoires pharmaceutiques et 1/8 par une institution. 4 Discussion Les résultats de ce travail montrent que le positionnement du SNI au cours des essais de non-infériorité est à l'origine d'une perte d'efficacité potentielle totale du nouveau traitement par rapport au traitement de référence dans six cas sur sept. Cela peut alors poser des difficultés dans l'interprétation des essais cliniques de non-infériorité. Ces difficultés sont probablement la conséquence du choix de seuils trop tolérants, puisque acceptant jusqu'à 434 % de perte d'efficacité potentielle, ce qui rend parfois difficile l'acceptation de la conclusion d'équivalence. D'ailleurs, Greene et al. [22] ont déterminé, qu'alors que la conclusion de certains essais était l'équivalence, il pouvait exister une différence d'efficacité réelle entre le traitement de référence et le nouveau traitement qui pouvait aller jusqu'à 76 %. On peut alors s'interroger sur la ou les raisons de cette tolérance excessive. D'un point de vue méthodologique, seule la détermination du positionnement du SNI semble imparfaite. La justification du seuil n'était pas conforme aux recommandations alors que la méthodologie générale de l'ensemble de ces études est excellente. L'autre défaut méthodologique répertorié dans ces essais de non-infériorité est le mode d'analyse des données. Contrairement à l'essai de supériorité, l'analyse potentiellement la moins biaisée dans l'essai de non-infériorité est l'analyse en per protocole, où seuls les patients traités en stricte conformité avec le protocole sont maintenus dans l'analyse. En effet, plusieurs composantes de l'analyse en ITT sont susceptibles de réduire la mesure de l'efficacité des traitements dans les deux groupes et en particulier celle du traitement de référence. La différence entre les groupes tend donc à diminuer ce qui, dans le cas de l'essai de non-infériorité, favorise la conclusion d'équivalence. Toutefois, l'utilisation de l'analyse PP suivie de l'analyse en ITT est préférable à l'analyse PP seule. En effet, la population de référence reste l'intention de traitement du fait du respect de la randomisation. Ces défauts méthodologiques ont également été rapportés. Les auteurs avaient montré que les particularités et la précision méthodologique n'étaient pas toujours adaptées dans les essais de non-infériorité [22] . La difficulté du positionnement du SNI vient également du manque d'un traitement de référence correctement validé. Ainsi, dans la plupart des essais sur la thrombose veineuse, le premier traitement de référence validé est l'héparine non fractionnée. Cette validation se base sur les résultats d'une seule étude [12] . Cette étude est depuis reprise systématiquement comme référence. Mais l'effectif très restreint de cette étude est à l'origine d'un manque de précision qui se traduit par un intervalle de confiance extrêmement large (RR : 0,33 ; IC 95 % : [0,11–0,98]). Cela implique que l'on ne peut pas exclure (à 95 %) que l'efficacité de l'héparine ne soit qu'une réduction de 0,02 du risque relatif. Or, dans le cadre des essais de non-infériorité, c'est cette efficacité minimale démontrée qui doit être prise en compte dans le positionnement du SNI. Mais, il est extrêmement difficile d'appliquer les recommandations et de préserver au moins 90 % de l'efficacité minimale démontrée alors que celle-ci est minime. Pour certains auteurs, le positionnement du SNI revêt une dimension essentiellement clinique et non un problème méthodologique. L'estimation de l'efficacité de l'héparine non fractionnée est imprécise. C'est pratiquement toujours le cas lorsque nous ne disposons que d'une seule étude de référence. En effet, l'effectif est alors calculé pour montrer une différence seuil de 5 % et l'intervalle de confiance est théoriquement très proche de 0 (–1,4 % dans l'étude de Brandjes). Ainsi l'utilisation de la borne péjorative de cet intervalle de confiance ne serait vraiment valide et utile, pour certains experts, que lorsque l'estimation de l'effet est précise (méta-analyse ou essai très puissant). De plus dans le cas de l'étude de Brandjes, il ne s'agit pas véritablement d'un essai contre placebo puisque tous les patients recevaient un AVK pendant trois mois, et que seuls les premiers jours de traitement étaient différents alors que les événements étaient comptabilisés à trois mois. Cet aspect n'est pas sans conséquence sur l'interprétation clinique des résultats. Toute règle pour l'établissement du SNI est donc étroitement dépendante du domaine considéré. Ce SNI pourrait être défini par les cliniciens experts du domaine et validé par les sociétés savantes concernées. Toutefois, la rigueur méthodologique et l'application des recommandations actuelles restent, à notre avis, les seules garanties d'une interprétation la moins biaisée possible par l'ensemble des lecteurs. Ces recommandations ont fait part de la nécessité de se comparer à l'efficacité du traitement versus placebo et d'en préserver au moins 90 % de l'effet [3,9] . Cette attitude de comparaison semble trop peu souvent utilisée, car trop contraignante. En effet, elle implique un nombre de sujets trop important lorsqu'elle est utilisée correctement, et certains groupes pharmaceutiques se sont plaints de la rigueur accrue exigée par la FDA en termes de seuil [10] . Une nouvelle approche semble donc nécessaire afin de clarifier la situation et faciliter les prises de décisions fondées sur des preuves. Certains auteurs proposent de ne plus avoir recours à la méthode de l'intervalle de confiance, mais d'utiliser la méthode du test de préservation qui est basée sur l'utilisation des résultats de l'étude versus placebo du traitement de référence [23] . Toutefois, cette méthode fait l'hypothèse de la comparabilité de populations non randomisées, et le résultat peut alors être influencé par les différences de caractéristiques des patients et de pronostic. L'autre solution proposée est celle de la méthode TACT ( two stage active control testing ) qui est un compromis entre la méthode précédente et celle du SNI avec son intervalle de confiance [24] . 5 Conclusion Le positionnement de ce seuil est un élément fondamental de l'essai de non-infériorité. Il nécessite une rigueur méthodologique afin que l'interprétation des résultats puisse être la plus exacte et la moins biaisée possible. Notre travail a permis de mettre en évidence des problèmes méthodologiques importants et très fréquents concernant la détermination du seuil de non-infériorité utilisé dans les essais de non-infériorité. Ceux-ci sont en effet beaucoup trop tolérants en termes de perte d'efficacité par rapport au traitement de référence. Cette perte d'efficacité a pour conséquence de considérer comme équivalents des traitements alors qu'il n'est pas exclu d'un point de vue statistique que le nouveau traitement fasse perdre la totalité de l'efficacité du traitement de référence. Ces données doivent être connues du lecteur afin qu'il puisse interpréter correctement les résultats de ces essais. Références [1] C.W. Dunnett M. Gent Significance testing to establish equivalence between treatments, with special reference to data in the form of 2 × 2 tables Biometrics 33 1977 593 602 [2] T.H. Ng Conventional null hypothesis testing in active control equivalence studies Control. Clin. Trials 16 1995 356 358 [3] E.B. Holmgren Establishing equivalence by showing that a specified percentage of the effect of the active control over placebo is maintained J. Biopharm. Stat. 9 1999 651 659 [4] R.B. D'Agostino Sr. J.M. Massaro L.M. Sullivan Non-inferiority trials: design concepts and issues — the encounters of academic consultants in statistics Stat. Med. 22 2003 169 186 [5] A.F. Ebbutt L. Frith Practical issues in equivalence trials Stat Med 17 15–16 1998 1691 1701 [6] J.H. Ware E.M. Antman Equivalence trials N. Engl. J. Med. 337 1997 1159 1161 [7] R. Makuch R. Simon Sample size requirements for evaluating a conservative therapy Cancer Treat. Rep. 62 1978 1037 1040 [8] B. Jones P. Jarvis J.A. Lewis A.F. Ebbutt Trials to assess equivalence: the importance of rigorous methods BMJ 313 1996 36 39 [9] ICH. Guidance for Industry. E10 Choice of control group and related issues in clinical trials. In: www.fda.gov/cder/guidance/index.htm; 2001. [10] D.M. Shlaes R.C. Moellering Jr. The United States Food and Drug Administration and the end of antibiotics Clin. Infect. Dis. 34 2002 420 422 [11] H.R. Buller B.L. Davidson H. Decousus A. Gallus M. Gent F. Piovella Subcutaneous fondaparinux vs intravenous unfractionated heparin in the initial treatment of pulmonary embolism N. Engl. J. Med. 349 2003 1695 1702 [12] D.P. Brandjes H. Heijboer H.R. Buller M. de Rijk H. Jagt J.W. ten Cate Acenocoumarol and heparin compared with acenocoumarol alone in the initial treatment of proximal-vein thrombosis N. Engl. J. Med. 327 1992 1485 1489 [13] G. Merli T.E. Spiro C.G. Olsson U. Abildgaard B.L. Davidson A. Eldor Subcutaneous enoxaparin once or twice daily compared with intravenous unfractionated heparin for treatment of venous thromboembolic disease Ann. Intern. Med. 134 2001 191 202 [14] The Columbus Investigators Low-molecular-weight heparin in the treatment of patients with venous thromboembolism N. Engl. J. Med. 337 1997 657 662 [15] B.A. Charbonnier J.N. Fiessinger J.D. Banga E. Wenzel P. d'Azemar L. Sagnard Comparison of a once daily with a twice daily subcutaneous low molecular weight heparin regimen in the treatment of deep vein thrombosis. FRAXODI group Thromb. Haemost. 79 1998 897 901 [16] J.F. Bergmann E. Neuhart A multicenter randomized double-blind study of enoxaparin compared with unfractionated heparin in the prevention of venous thromboembolic disease in elderly in-patients bedridden for an acute medical illness. The Enoxaparin in Medicine Study Group Thromb. Haemost. 76 1996 529 534 [17] L. Pinede J. Ninet P. Duhaut S. Chabaud S. Demolombe-Rague I. Durieu Comparison of 3 and 6 months of oral anticoagulant therapy after a first episode of proximal deep vein thrombosis or pulmonary embolism and comparison of 6 and 12 weeks of therapy after isolated calf deep vein thrombosis Circulation 103 2001 2453 2460 [18] A. Planes M.M. Samama A.W. Lensing H.R. Buller J. Barre N. Vochelle Prevention of deep vein thrombosis after hip replacement—comparison between two low-molecular heparins, tinzaparin and enoxaparin Thromb. Haemost. 81 1999 22 25 [19] H.R. Buller B.L. Davidson H. Decousus A. Gallus M. Gent F. Piovella Fondaparinux or enoxaparin for the initial treatment of symptomatic deep venous thrombosis: a randomized trial Ann. Intern. Med. 140 2004 867 873 [20] M.M. Koopman P. Prandoni F. Piovella P.A. Ockelford D.P. Brandjes J. van der Meer Treatment of venous thrombosis with intravenous unfractionated heparin administered in the hospital as compared with subcutaneous low-molecular-weight heparin administered at home. The Tasman Study Group N. Engl. J. Med. 334 1996 682 687 [21] W.C. Blackwelder “Proving the null hypothesis” in clinical trials Control. Clin. Trials 3 1982 345 353 [22] W.L. Greene J. Concato A.R. Feinstein Claims of equivalence in medical research: are they supported by the evidence? Ann. Intern. Med. 132 2000 715 722 [23] H.M. James Hung S.J. Wang Y. Tsong J. Lawrence R.T. O'Neil Some fundamental issues with non-inferiority testing in active controlled trials Stat. Med. 22 2 2003 213 225 [24] S.J. Wang H.M. Hung TACT method for non-inferiority testing in active controlled trials Stat. Med. 22 2003 227 238 [25] S. Siragusa B. Cosmi F. Piovella J. Hirsh J.S. Ginsberg Low-molecular-weight heparins and unfractionated heparin in the treatment of patients with acute venous thromboembolism: results of a meta-analysis Am. J. Med. 100 1996 269 277 [26] J.J. Belch G.D. Lowe A.G. Ward C.D. Forbes C.R. Prentice Prevention of deep vein thrombosis in medical patients by low-dose heparin Scott. Med. J. 26 1981 115 117 [27] A.G. van Den Belt M.H. Prins A.W. Lensing A.A. Castro O.A. Clark A.N. Atallah Fixed dose subcutaneous low molecular weight heparins versus adjusted dose unfractionated heparin for venous thromboembolism Cochrane Database Syst. Rev. 2 2000 (CD001100)

查看译文

关键词

Essais cliniques,Thromboses veineuses,Équivalence thérapeutique

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要