Seminar

Sélection stable de variables dans des modèles de durées de vie avec censure à droite : comparaison

Marie Walschaerts

June 14, 2011, 14:00–15:30

Toulouse

Room MS003

Statistics Seminar

Abstract

L'instabilité dans les modèles de sélection de variables est une préoccupation majeure dans le cas de jeux de données contenant un grand nombre de covariables. Cet article traite des méthodes de sélection de variables dans le cas des problèmes de grande dimension quand la variable d'intérêt est censurée à droite. Nous nous concentrons sur des nouvelles méthodes de sélection de variables par le biais de deux approches différentes utilisées en analyse de survie : le modèle de Cox et les arbres de survie. Pour cela, nous combinons des méthodes de rééchantillonnage (bootstrap) avec l'algorithme stepwise, la pénalisation L1 (ou Lasso) et les arbres de survie. Nous passons en revue ces différentes approches de sélection de variables et les appliquons à un jeu de donnée réel original sur l'infertilité. Nous comparons les performances de prédiction avec celles obtenues à partir de la méthodologie des forêts aléatoires de survie connue pour donner la plus petite erreur de prédiction, mais difficile à interpréter par les non-statisticiens. Nous comparons également leur facilité d'interprétation. L'objectif est de trouver un compromis entre un bon modèle prédictif et une facilité d'utilisation par les cliniciens.