09.07.2015 Views

Le modèle de Cox - SPLF

Le modèle de Cox - SPLF

Le modèle de Cox - SPLF

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Mémento biostatistique<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong>J.-F. Timsit 1 , C. Alberti 2 , S. Chevret 3Lorsque l’on souhaite expliquer le délai <strong>de</strong> survenue d’unévénement « en tout ou rien », par exemple un délai <strong>de</strong> survie,par une covariable (un traitement, une caractéristique du sujetou <strong>de</strong> sa maladie…), on peut dans un premier temps comparerles distributions <strong>de</strong> ces délais <strong>de</strong> survie selon la valeur <strong>de</strong> lacovariable. Un test du log-rank permet ensuite <strong>de</strong> tester l’égalité<strong>de</strong> ces fonctions <strong>de</strong> survie.Cependant,il est utile <strong>de</strong> pouvoir prendre en comptesimultanément l’effet <strong>de</strong> plusieurs covariables. Cela permet, nonseulement d’augmenter la puissance par exemple <strong>de</strong> la comparaison<strong>de</strong> groupes <strong>de</strong> traitement en homogénéisant les groupes àcomparer sur d’autres covariables, mais aussi d’éliminer les effetsnéfastes d’éventuels facteurs <strong>de</strong> confusion connus ou suspectésen « ajustant » la comparaison d’intérêt sur ceux-ci.Quand il n’est pas possible <strong>de</strong> contrôler a priori ces covariablesen construisant <strong>de</strong>s groupes <strong>de</strong> patients comparables(par stratification <strong>de</strong> la randomisation par exemple), il estnécessaire <strong>de</strong> les contrôler a posteriori lors <strong>de</strong> l’analyse <strong>de</strong>s données.<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong> permet la prise en compte simultanée<strong>de</strong> plusieurs variables pour expliquer la survenue d’un événementen tout ou rien, sans faire d’hypothèse sur la forme <strong>de</strong>sfonctions <strong>de</strong> survie. Ce modèle permet l’i<strong>de</strong>ntification etl’ajustement sur <strong>de</strong>s variables pronostiques lorsque l’on analyse<strong>de</strong> telles données, le plus souvent censurées (voir notesprécé<strong>de</strong>ntes).1 Réanimation Médicale, Groupe d’épidémiologie, U578 INSERM,et Service <strong>de</strong> réanimation médicale CHU A Michallon, Grenoble,France2 Unité d’Epidémiologie Clinique, INSERM CIE 5, AP-HP,Hôpital Robert Debré, Paris, France.3 Département <strong>de</strong> Biostatistique et Informatique Médicale,U717 INSERM, AP-HP, Hôpital Saint-Louis, Paris, France.Correspondance : J.-F. TimsitService <strong>de</strong> Réanimation Médicale, CHU A Michallon,38043 Grenoble Ce<strong>de</strong>x.jf.timsit@outcomerea.orgRéception version princeps à la Revue : 01.08.2005.Acceptation définitive : 01.08.2005.Pré requis : notion <strong>de</strong> risque instantanéNous nous sommes pour l’instant intéressé dans lesnotes précé<strong>de</strong>ntes [1] à la fonction <strong>de</strong> survie, S(t). Cette fonctionS(t) intègre l’ensemble <strong>de</strong>s événements observés avant tet décrit mal la dynamique instantanée du processus.La dynamique <strong>de</strong> ce processus peut s’exprimer sous laforme d’une fonction <strong>de</strong> risque instantané, traduisant lerisque <strong>de</strong> présenter l’événement sur un intervalle <strong>de</strong> tempsinfinitésimal, conditionnellement au fait <strong>de</strong> ne pas l’avoirRev Mal Respir 2005 ; 22 : 00-00Doi : 10.1019/200530109© 2005 <strong>SPLF</strong>, tous droits réservés1


J.-F. Timsit et coll.présenté auparavant. Cette fonction <strong>de</strong> risque peut être paramétrable(exprimable sous forme d’une formule mathématique).C’est le cas du modèle exponentiel (qui suppose unrisque instantané constant au cours du temps) et du modèle<strong>de</strong> Weibull.On peut aussi exprimer cette fonction <strong>de</strong> manière nonparamétrique (sans faire d’hypothèse sur son allure au coursdu temps). <strong>Le</strong> plus souvent, dans ce cas, on estime lafonction <strong>de</strong> risque instantanée h(t) par un estimateur <strong>de</strong>Kaplan-Meier :Pour chaque temps ti, la proportion d’évènementsobservés est h(t i )=m i /n i où m i est le nombre d’événementsobservés en ti et n i le nombre <strong>de</strong> sujets exposés au risqued’événement juste avant t i .La théorie : définition du modèle <strong>de</strong> <strong>Cox</strong><strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong> est une métho<strong>de</strong> <strong>de</strong> régression multivariéeau même titre que les modèles <strong>de</strong> régression logistiqueou <strong>de</strong> régression linéaire, qui consistent tous à modéliser lephénomène que l’on étudie, c’est-à-dire la variable Y caractérisantl’événement par une fonction <strong>de</strong> plusieurs autres variablescaractérisant les facteurs <strong>de</strong> risque et <strong>de</strong> confusionpotentiels, La variable Y est souvent appelée variable dépendante,tandis que les autres sont appelées variables indépendantes(ou prédicteurs).<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong> décrit la fonction <strong>de</strong> risque instantané(Y) en fonction <strong>de</strong> prédicteurs. Il exprime la fonction <strong>de</strong> risqueinstantané <strong>de</strong> l’individu i ayant un vecteur <strong>de</strong> p variablesexplicatives Z i = ( Z i1 , Z i2 , …,Z ip ) ′ sous une forme multiplicativeht () = h 0 ()exp t ( β ′ Z i ) (1)c’est-à-dire comme le produit d’une fonction <strong>de</strong> risque <strong>de</strong>base, h 0 () t , commune à tous les individus, et d’une fonction<strong>de</strong> régression explicitée paramétriquement, exp( β ′ Z i ), où β ′est un p-vecteur <strong>de</strong> coefficients <strong>de</strong> régression inconnus.À noter qu’en anglais, la fonction <strong>de</strong> risque instantané h(t) setraduit instantaneous hazard.Ce modèle sous-tend 2 hypothèses :– Il existe une relation log-linéaire entre fonction <strong>de</strong> risque instantanéet covariables :log h i()t----------- = ( β ′ Zh 0 () ti )– <strong>Le</strong> rapport <strong>de</strong>s fonctions <strong>de</strong> risque instantané pour 2 sujets iet j <strong>de</strong> caractéristiques Zi et Zj ne dépend que <strong>de</strong> Zi et Zj et nedépend pas du temps.h i ( tZ ; i ) exp( β ′ Z------------------i )= ----------------------- = exp( β ′ ( Zh j ( tZ ; j ) exp β ′ i – Z j ))= K( Z j )C’est-à-dire que les fonctions <strong>de</strong> risque instantané <strong>de</strong>s<strong>de</strong>ux individus i et j sont proportionnelles, et que leur rapport<strong>de</strong> proportionnalité ne dépend pas du temps t.La quantité K représente le rapport <strong>de</strong>s fonctions <strong>de</strong> risqueintantané <strong>de</strong>s individus ayant les caractéristiques Zi et <strong>de</strong>sindividus ayant les caractéristiques Zj. C’est le hazard ratio(noté HR) <strong>de</strong>s Anglo-Saxons.Hazard Ratio (HR) versus Risque Relatif (RR)On vient <strong>de</strong> voir que le modèle <strong>de</strong> <strong>Cox</strong> mesure <strong>de</strong>s rapports<strong>de</strong> fonctions <strong>de</strong> risque « instantané », donc <strong>de</strong>s risquesd’événement sur <strong>de</strong> touts petits intervalles <strong>de</strong> temps, en faisantl’hypothèse que ces rapports sont constants au cours dutemps.Supposons que l’on s’intéresse à un facteur d’expositionparticulier, en notant sa présence E, alors que l’absenced’exposition est notée E . Si on suppose que l’événement aune prévalence très faible, alors on peut considérer que le risquerelatif est approché par le hazard ratio selon 1 :λ( t ( Z = E)) exp[ βRR ≈ HR -------------------------------x ( Z = E)]= = --------------------------------------- = exp( β x )λ( t ( Z = E)) exp[ β x ( Z = E)]Application à la prédiction <strong>de</strong> survenued’une pneumonie nosocomialeDans un premier temps, nous cherchons à estimer lesfacteurs prédictifs <strong>de</strong> la survenue d’une pneumonienosocomiale. Nous disposons d’un jeu <strong>de</strong> données provenant<strong>de</strong> la base <strong>de</strong> données OUTCOMEREA et utiliséprécé<strong>de</strong>mment 1 .Ce jeu <strong>de</strong> données décrit les données <strong>de</strong> 747 patientsventilés plus <strong>de</strong> 48 heures. 151 patients ont développé unepneumonie nosocomiale. La date d’origine est le 3 e jour <strong>de</strong>ventilation mécanique. <strong>Le</strong>s patients sont censurés le jour <strong>de</strong>l’extubation ou au 30 e jour <strong>de</strong> ventilation mécanique. Ladurée médiane <strong>de</strong> suivi est <strong>de</strong> 7 jours.<strong>Le</strong> tableau I présente un exemple <strong>de</strong> données <strong>de</strong>8 patients <strong>de</strong> cette base. Pour décrire la survenue <strong>de</strong> la pneumopathienosocomiale, on dispose <strong>de</strong> <strong>de</strong>ux colonnes, mesurantchez chaque sujet, la durée d’exposition (durée, expriméeen jours), et l’indicatrice <strong>de</strong> survenue d’une pneumonie(PN = 1 si pneumopathie, 0 sinon). La durée est calculée entrele 3 e jour <strong>de</strong> ventilation mécanique et la date <strong>de</strong> survenue <strong>de</strong>l’événement pour ceux ayant présenté une pneumopathie(ex : obs 1005, 1007 à 1010), entre le 3 e jour <strong>de</strong> ventilationmécanique et le jour d’extubation pour ceux n’ayant pas présentél’événement (ex : obs 1001, 1004 et 1006) et enfin entrele 3 e jour <strong>de</strong> ventilation mécanique et le 30 e jour pour lespatients non extubés au 30 e jour (ex : obs 1003).<strong>Le</strong>s variables explicatives sont l’âge en années (AGE), lesexe masculin (SEXMASC) et l’utilisation <strong>de</strong> céphalosporinesdans les 48 premières heures d’hospitalisation en réanimation(CEPHALO48).1 NB : Cette interprétation du hazard ratio (HR) comme un risque relatifn’est pas vali<strong>de</strong> lorsque le rapport <strong>de</strong>s fonctions <strong>de</strong> risque n’est pas constantau cours du temps ou lorsque le risque absolu <strong>de</strong> l’événement n’est pasfaible.2Rev Mal Respir 2005 ; 22 : 00-00


<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong>Tableau I.Échantillon <strong>de</strong>s données à analyser.OBS AGE DUREE PN SEXMASC CEPHALO481001 54 8 0 0 01003 49 30 0 1 01004 72 3 0 0 01005 57 27 1 1 01006 69 15 0 1 11007 64 28 1 1 01008 31 2 1 1 01010 63 10 1 1 0Commençons par étudier la variable SEXMASC :D’après (1), un individu <strong>de</strong> sexe masculin est représentépar la fonction <strong>de</strong> risque instantané d’avoir une pneumonienosocomiale suivante :h i ( t ⁄ SEXMASC = 1) = h 0 texp( β SEXMASC × 1)=h 0 () t exp( β SEXMASC )et pour un individu <strong>de</strong> sexe féminin :h i ( t ⁄ SEXMASC = 0) = h 0 texp( β SEXMASC × 0)= h 0 () t<strong>Le</strong> rapport <strong>de</strong>s risques instantanés (hazard ratio ou HR)représente le rapport <strong>de</strong>s fonctions <strong>de</strong> risque instantané <strong>de</strong>pneumonie nosocomiale <strong>de</strong>s hommes par rapport auxfemmes :hHR i ( t ⁄ SEXMASC = 1)SEXMASC= --------------------------------------------------- =h i ( t ⁄ SEXMASC = 0)h 0 texp( β SEXMASC )----------------------------------------------- = exp( βh 0 tSEXMASC )<strong>Le</strong>s logiciels du commerce permettent d’estimer XXX etson intervalle <strong>de</strong> confiance.Dans l’exemple qui nous intéresse, le logiciel SAS estimeβ SEXMASC = 0,646 avec un écart type <strong>de</strong> 0,186 ce qui nousdonne un HR = exp(0,646) = 1,91 avec un intervalle <strong>de</strong> confiance(IC) à 95 % [1,33-2,75], p = 0,0005. Autrement dit, lesexe masculin multiplie par 1,91 le risque instantané d’acquisitiond’une pneumonie nosocomiale par rapport à celui <strong>de</strong>sfemmes. <strong>Le</strong> test statististique teste l’hypothèse nulle queβ SEXMASC = 0 (et donc que le HR=exp(0)=1) contre l’hypothèsealternative, β SEXMASC ≠ 0 . <strong>Le</strong> test étant significatif auseuil <strong>de</strong> 5 %, on peut dire que le risque <strong>de</strong> pneumonie estaugmenté <strong>de</strong> façon significative chez les hommes par rapportaux femmes (et l’on peut remarquer que la valeur 1 est exclue<strong>de</strong> l’IC à 95 %).De même, nous pouvons estimer le paramètre pour lavariable CEPHALO48 donnant β CEPHALO48 = – 0,289avec un écart type <strong>de</strong> 0,212. Ceci nous donne un HR = exp(– 0,289) = 0,75 avec un intervalle <strong>de</strong> confiance à 95 % <strong>de</strong>(0,49-1,13), p = 0,18. La variable n’a donc pas d’influence statistiquementsignificative au risque <strong>de</strong> 5 % sur le risque instantanéd’acquisition d’une pneumonie nosocomiale.Ce résultat est étonnant par rapport aux résultats <strong>de</strong> lalittérature et aux résultats obtenus sur la même base <strong>de</strong> donnéesqui montraient l’utilisation <strong>de</strong> céphalosporines dans les48 premières heures <strong>de</strong> ventilation protégeait <strong>de</strong> la survenue<strong>de</strong> pneumonie nosocomiale précoce… Nous allons enreparler….Pour les variables quantitatives comme l’âge, l’HR estestimé pour une augmentation d’une unité <strong>de</strong> la valeur <strong>de</strong> lavariable selon le rapport suivant :hHR i ( t ⁄ ( AGE = x+1))AGE= --------------------------------------------------- =h i ( t ⁄ AGE = x)h 0 texp( ( x + 1)β AGE )---------------------------------------------------- = exp( βh 0 texp( β AGE )AGE )C’est une illustration <strong>de</strong> l’hypothèse <strong>de</strong> log-linéarité vueplus haut, qui ne concerne bien sûr que les covariables discrètes(à plus <strong>de</strong> <strong>de</strong>ux classes) ou continues. Pour la variable AGEle logiciel SAS nous donneβ AGE = 0,0111 avec un écart type <strong>de</strong> 0,0060, correspondantà un HR = exp(0,0111) = 1,011 avec un intervalle <strong>de</strong> confianceà 95 % <strong>de</strong> (0,999-1,023), p = 0,067.Cet HR correspond à l’augmentation du risque instantané<strong>de</strong> pneumonie nosocomiale associé à une augmentation<strong>de</strong> l’âge <strong>de</strong> 1 unité, et dans notre exemple <strong>de</strong> 1 an. Ceci a pourconséquence qu’un accroissement <strong>de</strong> 1 unité <strong>de</strong> la valeur <strong>de</strong>l’âge correspond une augmentation du risque instantané <strong>de</strong>pneumonie, i<strong>de</strong>ntique que l’on passe <strong>de</strong> 40 à 41 ans ou <strong>de</strong> 80 à81 ans.Si l’on veut calculer l’HR associé à une augmentation<strong>de</strong> l’âge <strong>de</strong> n années, il sera égal à (HR AGE ) n soit par exemplepour une augmentation <strong>de</strong> l’âge <strong>de</strong> 10 ans 1,0111 10 = 1,12.Nous avons estimé pour chaque variable son influencesur le risque instantané d’acquisition d’une pneumonie(métho<strong>de</strong> dite univariée, référant à l’utilisation d’un facteur<strong>de</strong> risque dans le modèle, ou parfois bivariée, référant à l’utilisation<strong>de</strong> 2 variables, l’une dépendante et l’autre indépendante).De la même manière, le modèle permet d’estimersimultanément les valeurs <strong>de</strong>s paramètres pour les 3 variablesAGE, CEPHALO48 et SEXMASC (métho<strong>de</strong> multivariée oumultivariable).Si nous introduisons les 3 variables dans le modèle.Pour l’individu i tel queh i () t = h 0 () t exp( β ACE Z 1i+ β CEPHALO48 Z 2i+ β SEXMASC).<strong>Le</strong> modèle obtenu est représenté dans le tableau II. End’autres termes, un âge élevé et le sexe masculin sont <strong>de</strong>s facteurs<strong>de</strong> risque d’acquisition <strong>de</strong> pneumonie nosocomiale alorsque l’utilisation <strong>de</strong> céphalosporine dans les 48 premières heuresn’en est pas un, au risque <strong>de</strong> 5 %.Ce résultat pourrait être acceptable, il va cependant àl’encontre <strong>de</strong>s données <strong>de</strong> la littérature. Vérifions les hypothèsessous jacentes au modèle.© 2005 <strong>SPLF</strong>, tous droits réservés 3


J.-F. Timsit et coll.Tableau II.Modèle <strong>de</strong> <strong>Cox</strong> prenant en compte les variables du modèle nontransformées.VariablesEstimation<strong>de</strong> βÉcarttype<strong>de</strong> βHR = exp(β) IC 95% PÂge 0,014 0,0063 1,014 1,002-1,027 0,02SEXMASC 0,682 0,187 1,978 1,370-2,856 0,0003CEPHALO48 – 0,229 0,213 0,795 0,524-1,206 0,28contenantmodèledumartingale<strong>de</strong>RésidusCEPHALO48SEXMASC et1.00.50.0-0.520 40 60 80 100AGEFig. 1.Résidus <strong>de</strong> martingale du modèle contenant SEXMASC etCEPHALO48 selon l’âge.Hypothèse <strong>de</strong> loglinéarité :application à la variable AGEPlusieurs métho<strong>de</strong>s existent pour évaluer l’écart à la loglinéarité<strong>de</strong>s variables continues. Parmi celles-ci, une consisteà analyser l’ensemble <strong>de</strong>s différences entre le risque instantanécalculé par le modèle et le risque observé <strong>de</strong> pneumonie. Elleest basée sur l’analyse <strong>de</strong>s résidus <strong>de</strong> la martingale dont le calculcomplexe ne sera pas détaillé ici. Cette analyse permetd’i<strong>de</strong>ntifier <strong>de</strong>s écarts importants à la log-linéarité.Dans la figure 1, les résidus <strong>de</strong> la martingale d’un modèlecontenant SEXMASC et CEPHALO48 sont en ordonnée etla variable AGE en abscisse. La ligne représente la relationentre x et y en utilisant une fonction <strong>de</strong> lissage (obtenue grâceau logiciel S-Plus). Si la relation est globalement linéaire(représentée par une droite), on peut en déduire qu’il existeune relation log-linéaire entre les valeurs <strong>de</strong> cette variable et lerisque <strong>de</strong> pneumonie. Dans notre exemple, nous obtenons àpeu près une droite et nous n’avons pas d’éléments cliniquespour supposer que la relation entre l’age est la pneumonie nesoit pas log-linéaire. Une telle approche est cependant trèspeu sensible.Une autre métho<strong>de</strong> consiste à découper la variable enclasses d’effectifs équivalents comme les quartiles (25 e percentileou Q1, 75 e percentile ou Q3) tels que [min,Q1] ;[Q1,médiane] ; [médiane,Q3] ; [Q3,max]. On choisit uneclasse <strong>de</strong> référence pour laquelle le HR vaudra 1 et les HR <strong>de</strong>sautres classes seront estimés par rapport à la classe <strong>de</strong> référence.Ensuite, les HR sont représentés en ordonnée sur ungraphe avec les classes d’age par ordre croissant en abscisse. Siune droite passe par les points, on peut raisonnablementaccepter la relation log-linéaire entre l’age et le risque <strong>de</strong>pneumonie.Dans notre exemple, la figure 2 représente les HR pourles différentes classes d’âge crées. On n’observe pas une augmentationlinéaire du HR.En pratique : Faut-il utiliser <strong>de</strong>s variables continuesou les transformer ?Il est évi<strong>de</strong>nt que l’information âge = 22 ans est plusriche que l’information âge < 50 ans. Aussi, si l’on peut raisonnablementaccepter l’hypothèse <strong>de</strong> loglinéarite, la variabledoit rester continue. Cette hypothèse a pour conséquencesqu’une augmentation <strong>de</strong> l’age <strong>de</strong> 5 ans multiplie le risque <strong>de</strong>pneumonie par exp(5β) que l’on passe <strong>de</strong> 20 à 25 ans ou <strong>de</strong>70 à 75 ans. C’est une hypothèse forte qui n’est généralementpas recommandée.Si l’on choisit <strong>de</strong> transformer une variable quantitativecontinue en une variable à n classes ordonnées, se pose le problèmedu nombre <strong>de</strong> classes et du choix <strong>de</strong>s seuils pourdécouper cette variable. La transformation peut être simple enclasses en utilisant la moyenne ou la médiane <strong>de</strong> la variablecontinue ou plus complexe en utilisant les tertiles pour undécoupage en 3 classes ou les quartiles pour un découpage en4 classes. L’information la plus réduite est associée au pluspetit nombre <strong>de</strong> classes.Si on choisit le découpage en 4 classes (information laplus riche), la variable AGE sera recodée selon les modalitéssuivantes : une classe <strong>de</strong> référence (par exemple la classe[min,Q1[ et 3 variables binaires z 1 , z 2 , z 3 telles queh i () t = h 0 () t exp( β 1 Z 1 + β 2 Z 2 + β 3 Z 3 )dans notre exemple nous obtenons le tableau III.L’effet <strong>de</strong> l’age doit être testé en comparant globalementles coefficients à (0,0,0).Hazard ratio3,532,521,510,50loglinéarité <strong>de</strong> la variable AGE[min,Q1[ [Q1,médiane[ [médiane,Q3[ [Q3,max]Fig. 2.Loglinéarité <strong>de</strong> la variable Âge.4Rev Mal Respir 2005 ; 22 : 00-00


<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong>En effet si l’on teste séparément chaque coefficient, celarevient à estimer l’effet d’une tranche d’âge par rapport àl’ensemble <strong>de</strong>s autres. Cette comparaison a rarement un sensclinique et est la plupart du temps difficile à interpréter.Pour éviter ce problème, on peut proposer un autre type<strong>de</strong> recodage en classes emboîtées avec les 3 variables binairesz’1, z’2, z’3 (tableau IV).Eth i () t = h 0 () t exp( β′ 1 Z′ 1 + β′ 2 Z′ 2 + β′ 3 Z′ 3 )Ce type <strong>de</strong> recodage permet <strong>de</strong> comparer chaque β i à 0et <strong>de</strong> pouvoir les interpréter <strong>de</strong> façon indépendante.Dans notre exemple le codage expliqué est représentédans le tableau V et les résultats <strong>de</strong> la modélisation dans letableau VI.Comme nous utilisons un codage emboîté, la variableCLAGE1 qui seule apporte une information significative aumodèle peut être conservée seule.Etant donné les risques pris en conservant la variableAGE en continu et l’apport pronostique <strong>de</strong> la variableCLAGE1, nous pouvons construire un modèle simplifiéqui n’inclut que CLAGE1,SEXMASC et CEPHALO48(tableau VII).Tableau III.Transformation <strong>de</strong> la variables en 4 classes en 3 variables binairesnon emboîtées.[min,Q1] [Q1,médiane] [mediane,Q3] [Q3,max]Z1 0 0 0 1Z2 0 0 1 0Z3 0 1 0 0Tableau IV.Transformation <strong>de</strong> la variables en 4 classes en 3 variables binairesemboîtées.[min,Q1] [Q1,médiane] [mediane,Q3] [Q3,max]Z’1 0 1 1 1Z’2 0 0 1 1Z’3 0 0 0 1Tableau V.Recodage <strong>de</strong> la variable Clage en 3 variables binaires emboitées.moins<strong>de</strong> 58 ans58-69 ans 69-77 ans 77 ans et plusCLAGE1 0 1 1 1CLAGE2 0 0 1 1CLAGE3 0 0 0 1<strong>Le</strong> modèle qui contient la variable binaire CLAGE1n’est pas comparable facilement avec le modèle qui contientla variable AGE car il s’agit <strong>de</strong> modèles non emboîtés. <strong>Le</strong>choix peut soit dépendre <strong>de</strong> tests statistiques dont l’intérêt estdiscuté soit et surtout du bon sens clinique. Il peut paraitreplus informatif pour un clinicien d’utiliser et <strong>de</strong> retenir unseuil pronostique plutôt que <strong>de</strong> simplement savoir que le risqueaugmente avec l’âge.Hypothèse <strong>de</strong>s risques proportionnelsCe résultat n’est exact que si l’on vérifie que le rapport(c’est le rapport <strong>de</strong>s risques instantanés ou la différence <strong>de</strong>slogarithmes) <strong>de</strong>s risques instantanés <strong>de</strong> survenue d’une pneumonieest globalement constant au cours du temps. La proportionnalité<strong>de</strong>s risques au cours du temps est difficile à voirsur le graphique <strong>de</strong> 2 courbes <strong>de</strong> survie, S(t), correspondantaux <strong>de</strong>ux modalités d’une variable binaire (comme sexe masculinou féminin). Elle mieux explorée par la fonctiony = Log[-Log[S(t)]] (fig. 3).Pour la variable SEXMASC, et la variable CLAGE1, les2 courbes sont grossièrement parallèles et l’hypothèse <strong>de</strong>s risquesproportionnels semble vérifiée.Pour la variable CEHALO48 (utilisation <strong>de</strong> céphalosporinesdans les 48 premières heures d’hospitalisation en réanimation),la situation est différente. Dans les temps <strong>de</strong> suiviprécoces, la prise <strong>de</strong> céphalosporine dans les 48 premièresheures semble être associée à un risque moindre <strong>de</strong> pneumo-Tableau VI.Modélisation utilisant la variable CLAGE transformée en 3 variablesbinaire emboitées (tableau V).VariablesEstimation<strong>de</strong> βÉcarttype<strong>de</strong> βHR =exp(β)IC 95 %CLAGE1 0,60087 0,25162 1,824 1,114-2,986 0,017(Âge ≥ 58 ans)CLAGE2 – 0,17723 0,21286 0,838 0,552-1,271 0,4051(Âge ≥ 69 ans)CLAGE3 0,16094 0,22242 1,175 0,760-1,816 0,4693(Âge ≥ 77ans)SEXMASC 0,67407 0,188 1,962 1,355-2,841 0,0004CEPHALO48 – 0,20341 0,21322 0,816 0,537-1,239 0,34Tableau VII.Modélisation i<strong>de</strong>ntique à celle du tableau VI mais ne conservantque la variable CLAGE1.VariablesEstimation<strong>de</strong> βÉcarttype<strong>de</strong> βHR =exp(β)IC 95 %CLAGE1 0,53413 0,22329 1,706 1,101-2,643 0,017(Âge ≥ 58 ans)SEXMASC 0,67074 0,186 1,956 1,357-2,818 0,0003CEPHALO48 – 0,21241 0,21295 0,809 0,533-1,227 0,32PP© 2005 <strong>SPLF</strong>, tous droits réservés 5


J.-F. Timsit et coll.Log(-Log[Taux <strong>de</strong> survie sans PN]survie sans PN]Log(-Log[Taux <strong>de</strong>PN]<strong>de</strong> survie sansLog(-Log[Taux0-0,5-1-1,5-2-2,5-3-3,5Evaluation graphique <strong>de</strong> l'hypothèse <strong>de</strong>s risques proportionnels(variable CLAGE1)-40 5 10 15 20 25 30 350-0,5-1-1,5-2-2,5-3-3,5-4Durée <strong>de</strong> suiviCLAGE1=0CLAGE1=1Evaluation graphique <strong>de</strong> l'hypothèse <strong>de</strong>s risques proportionnels(variable CEPHALO48)-4,50 5 10 15 20 25Durée <strong>de</strong> suivi0-0,5-1-1,5-2-2,5-3-3,5-4CEPHALO=0CEPHALO=1Evaluation graphique <strong>de</strong> l'hypothèse <strong>de</strong>s risques proportionnels(variable SEXMASC)-4,50 5 10 15 20 25 30Durée <strong>de</strong> suiviFig. 3.Évaluation graphique <strong>de</strong> la proportionnalité <strong>de</strong>s risques.nie alors que plus tardivement, la différence est moins nette,allant même jusqu’à s’inverser (les courbes se croisent).L’interprétation purement qualitative <strong>de</strong> cette métho<strong>de</strong>graphique peut être étayée par <strong>de</strong>s métho<strong>de</strong>s quantitatives.<strong>Le</strong>s métho<strong>de</strong>s proposées sont nombreuses [1].Ceci peut traduire un effet limité dans le temps <strong>de</strong>scéphalosporines. Nous pouvons tester l’hypothèse <strong>de</strong> la différence<strong>de</strong> risque au cours du temps en introduisant une variableHRP-CEPHALO qui vaut 0 si le temps t est inférieur à7 jours (délai médian <strong>de</strong> suivi) et qui vaut CEPHALO48 au<strong>de</strong>là.<strong>Le</strong> logiciel SAS nous dit alors que l’estimation du coefficientβ associé à HRP-CEPHALO vaut 1,113 est qu’il estsignificativement différent <strong>de</strong> 0 (p = 0,015). L’hypothèse <strong>de</strong> laproportionnalité <strong>de</strong>s risques pour la variable CEPHALO48doit donc être rejetée.Que faire lorsque l’hypothèse <strong>de</strong>s risquesproportionnels n’est pas vérifiée ?Une stratification sur la variable CEPHALO48Si l’hypothèse <strong>de</strong>s risques instantanés proportionnels dumodèle <strong>de</strong> <strong>Cox</strong> n’est pas vérifiée, le modèle que nous avonsconçu précé<strong>de</strong>mment est partiellement inexact. Pour l’estimationdu hasard ratio associé à la variable CLAGE1 et à la variableSEXMASC, nous pouvons stratifier le modèle <strong>de</strong> <strong>Cox</strong> enfonction <strong>de</strong> la valeur <strong>de</strong> la variable CEPHALO48. Nous obtenonsainsi une estimation moins biaisée <strong>de</strong>s HR pourAGE et SEXMASC : SEXMASC : HR = 1,93 [1,34 ; 2,79],p = 0,0004 et CLAGE1 : HR = 1,68 [1,08 ; 2,60], p = 0,021 ;Cependant cette approche permet <strong>de</strong> prendre en comptela variable CEPHALO48 mais ne permet pas d’en estimerl’impact pronostique.Une modélisation introduisant une covariable dépendantedu tempsFaisons l’hypothèse que l’effet <strong>de</strong> la prise <strong>de</strong> céphalosporinesà l’admission en réanimation est différent en débutd’hospitalisation et en fin d’hospitalisation, il est possibled’écrire un modèle où CEPHALO48 est remplacé parCEPHALO48t qui prend la valeur <strong>de</strong> CEPHALO48 pendantles 7 premiers jours <strong>de</strong> suivi et la valeur 0 ensuite. <strong>Le</strong>s résultatsdu modèle sont dans le tableau VIII.Ce modèle nous indique que l’usage <strong>de</strong>s céphalosporinesdans les 48 heures diminue le risque instantané d’acquérirune pneumonie dans les 7 premiers jours <strong>de</strong> suivi 1 .Une modélisation par partieNous pouvons aussi considérer séparément l’analysejusqu’à 7 jours <strong>de</strong> suivi et l’analyse à partir du 8 e jour <strong>de</strong> suivi.Nous allons donc créer 2 modèles <strong>de</strong> <strong>Cox</strong> (tableau IX) :– le premier recherche les facteurs associés à la survenue d’unepneumonie dans les 7 premiers jours <strong>de</strong> suivi (les mala<strong>de</strong>s encoreventilés sont censurés au 7 e jour) ;– le <strong>de</strong>uxième les facteurs associés à la survenue à la pneumonieaprès les 7 premiers jours <strong>de</strong> suivi (seul les patients suivisplus <strong>de</strong> 7 jours et qui n’ont pas encore présenté <strong>de</strong> pneumonieau 7 e jour sont pris en compte).Cette troisième métho<strong>de</strong>, plus aisée à expliquer nousdit que l’absence d’utilisation <strong>de</strong>s céphalosporines dans les48 premières heures <strong>de</strong> ventilation comme l’âge > 58 ans et lesexe masculin sont <strong>de</strong>s facteurs <strong>de</strong> risque <strong>de</strong> pneumonie nosocomialeprécoce (survenant dans les 7 premiers jours <strong>de</strong>suivi).Par contre, l’utilisation <strong>de</strong> céphalosporines dans les 48 premièresheures <strong>de</strong> ventilation ne protège pas du tout (voir mêmele contraire) <strong>de</strong> la pneumonie nosocomiale survenant plus tardivement(après le 7 e jour <strong>de</strong> suivi).1 NB : la variable cephalo48(t) est une variable dépendante du temps. Dansce cas l’interprétation du hasard ratio est plus délicate. Celui ci ne peut pasêtre directement considéré comme un risque relatif.6Rev Mal Respir 2005 ; 22 : 00-00


<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong>Tableau VIII.Modèle <strong>de</strong> <strong>Cox</strong> introduisant la variable CEPHALO48(t).VariablesEstimation<strong>de</strong> βÉcarttype<strong>de</strong> βHR =exp(β)IC 95 %CLAGE1 0,52157 0,22303 1,685 1,088-2,608 0,019(Âge ≥ 58 ans)SEXMASC 0,65807 0,186 1,931 1,340-2,782 0,0004CEPHALO48 (t)– 0,85020 0,37326 0,427 0,206-0,888 0,023Tableau IX.Modèle <strong>de</strong> <strong>Cox</strong> par partie qui modélise la survenue <strong>de</strong> pneumonienosocomiale jusqu’au 7 e jour <strong>de</strong> suivi (partie supérieure du tableau)et après le 7 e jour <strong>de</strong> suivi (partie inférieure du tableau) <strong>de</strong> façonséparée.Entre le premier et le 7 e jour <strong>de</strong> suiviVariables Estimation ÉcarttypeHR = exp(β) IC 95 % P<strong>de</strong> β<strong>de</strong> βCLAGE1 0,58774 0,28317 1,800 1,033-3,135 0,038(Âge ≥ 58 ans)SEXMASC 0,70894 0,24953 2,032 1,246-3,314 0,0045CEPHALO48 – 0,74788 0,33622 0,473 0,245-0,915 0,026Après le 7 e jour <strong>de</strong> suiviVariables Estimation ÉcarttypeHR = exp(β) IC 95 % P<strong>de</strong> β<strong>de</strong> βCLAGE1 0,59797 0,36248 1,818 0,894-3,700 0,099(Âge ≥ 58 ans)SEXMASC 0,60775 0,2814 1,836 1,058-3,188 0,031CEPHALO48 0,34094 0,2860 1,406 0,803-2,464 0,233Comme prévu, le HR pour CLAGE1 et SEXMASC estgrossièrement i<strong>de</strong>ntique pour les <strong>de</strong>ux modèles.Censure non informativeUne autre hypothèse, commune à toutes les analysescensurées, que nous avions déjà développé lors <strong>de</strong>s notesméthodologiques précé<strong>de</strong>ntes, porte sur la nature <strong>de</strong> la censure.<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong> suppose que la censure est non informative.C’est-à-dire que la censure est indépendante du risquePd’acquérir un événement. Pour l’exemple qui nous intéresse,la censure la plus courante est la sortie <strong>de</strong> réanimation. Onfait l’hypothèse que le risque instantané <strong>de</strong> survenue d’unepneumonie nosocomiale pour les individus sortis vivants <strong>de</strong>réanimation n’est pas modifié par la sortie. Il est donc lemême que celui d’un individu encore en réanimation à untemps t donné. Dans notre cas, c’est une hypothèse assez fortecas car on sait que le risque d’acquisition d’une pneumonienosocomiale chez un patient sorti vivant <strong>de</strong> réanimation estplus faible que celui d’un individu encore intubé toujours enréanimation.Il existe probablement une compétition entre le risque<strong>de</strong> sortir vivant <strong>de</strong> réanimation et le risque d’acquisition d’unepneumonie. Une extension du modèle <strong>de</strong> <strong>Cox</strong> tenant compte<strong>de</strong> la compétition entre différents risques a été récemmentdéveloppée est peut être plus adaptée dans ce cas.Conclusion<strong>Le</strong> modèle <strong>de</strong> <strong>Cox</strong> est tout à fait adapté à la modélisationmultivariées <strong>de</strong> données censurées. Il convient d’en connaîtreles hypothèses (loglinéarité <strong>de</strong>s variables, proportionalité <strong>de</strong>srisques, censure non informative) pour l’utiliser et l’interpréterà bon escient. Pour en savoir plus : [2-4].Références1 Bornstain C, Azoulay E, De Lassence A, Cohen Y, Costa MA,Mourvillier B, Descorps-Declere A, Garrouste-Orgeas M, Thuong M,Schlemmer B, Timsit JF; Outcomerea Study Group : Sedation,sucralfate, and antibiotic use are potential means for protectionagainst early-onset ventilator-associated pneumonia. Clin Infect Dis2004 ; 38 : 1401-8.2 Collet D : Mo<strong>de</strong>lling survival data in medical research. Chapman &Hall, 1994.3 Parmar MKB, Machin D : Survival analysis. J Wiley & sun Ed ;UK 1995.4 Hill C, Com-Nougué C, Kramar A, Moreau T, O’Quigley J,Senoussi R, Chastang C : Analyse statistique <strong>de</strong>s données <strong>de</strong> survie.Flammarion Mé<strong>de</strong>cine et sciences Ed 1996.© 2005 <strong>SPLF</strong>, tous droits réservés 7

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!