Stratégie de modélisation de la forme fonctionnelle des variables continues dans un modèle de régression en utilisant des splines cubiques restreintes

L. Gauthier, S. Gourgou,C. Touraine, F. Castan, D. Azria, P. Lemercier, M. Monnier, W. Chaoui,A. Winter

Revue d'Épidémiologie et de Santé Publique(2023)

引用 0|浏览2
暂无评分
摘要
Lorsque l'on souhaite modéliser la relation entre une variable continue et une variable réponse, le choix du traitement de la variable continue, i.e. de sa forme fonctionnelle, est une étape clé. Ce choix se résume trop souvent à la catégorisation de la variable continue, en deux ou plusieurs catégories. La catégorisation, bien qu'offrant une facilité d'interprétation, pose toutefois des problèmes majeurs. Elle suppose une relation par palier avec la réponse qui est irréaliste et entraîne une perte d'information, et donc une perte de précision dans les estimations et une perte de puissance dans les tests associés. Dans le cas d'une variable confondante, la catégorisation entraîne de surcroît de la confusion résiduelle non expliquée par le modèle. De plus, la catégorisation induit une inflation du risque alpha lorsque les « cut-off » sont déterminés à partir de la variable réponse. Enfin, les "cut-off" choisis sont souvent hétérogènes entre les études, rendant les comparaisons difficiles. Une autre méthode consiste à traiter la variable continue en supposant une association linéaire, hypothèse souvent non respectée. Pourtant, plusieurs outils tels que les splines ou les polynômes fractionnaires permettent de modéliser la forme fonctionnelle d'une variable continue de manière très flexible. Notre objectif est de décrire la mise en œuvre d'une telle modélisation et de l'illustrer sur un exemple concret. Une revue de littérature a été réalisée afin de définir une stratégie de modélisation. Pour illustrer cette dernière, nous avons utilisé une étude multicentrique française de 352 patients atteints d'un cancer de la prostate. Le but était d’étudier l'impact de l'apoptose des lymphocytes-T CD8 induite par la radiothérapie (RILA) sur la survie sans toxicité tardive à l'aide d'un modèle de Cox « cause-specific ». La variable continue (RILA) a d'abord été intégrée au modèle multivariable en utilisant une spline cubique restreinte. L'avantage de ce type de splines est de permettre de vérifier l'hypothèse de linéarité en testant la nullité de certains de ses coefficients. Le choix du nombre de nœuds et de leur position sera discuté. Ici, cinq nœuds ont été choisis à l'aide du critère AIC et ont été placés aux quantiles de distribution du RILA. L'association n’étant pas linéaire, la modélisation par spline a été maintenue. Une communication classique des résultats avec report des coefficients de régression n'est pas informative, les coefficients de splines n'ayant pas d'interprétation directe. Différentes méthodes d'interprétation du modèle final peuvent être proposées. Dans notre étude, les contrastes entre l'ensemble des valeurs du RILA et une valeur de référence ont été estimés et tracés, permettant de visualiser les mesures d'effet. À titre illustratif, les prédictions de la survenue de toxicité tardive en fonction du RILA ont aussi été représentées graphiquement. Les splines cubiques restreintes permettent de modéliser de façon flexible la relation entre une variable continue et la variable réponse lorsque cette dernière est non linéaire. Elles peuvent être appliquées aux modèles dont les paramètres sont estimés par maximum de vraisemblance ou méthode des moindres carrés. Elles utilisent l'ensemble de l'information disponible et l'interprétation qui en découle est riche. De plus, leur implémentation dans de nombreux logiciels rend accessible leur utilisation.
更多
查看译文
关键词
Spline,Forme fonctionnelle,Modéle de regression,Catégorisation de variable
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要