Évaluation du raisonnement clinique en médecine d'urgence - CPASS

Évaluation du raisonnement clinique en médecine d'urgence - CPASS Évaluation du raisonnement clinique en médecine d'urgence - CPASS

cpass.umontreal.ca
from cpass.umontreal.ca More from this publisher
12.07.2015 Views

Recherche et PerspectivesÉvaluation du raisonnement clinique en médecine d’urgence :les tests de concordance des scripts décèlent mieux l’expérienceclinique que les questions à choix multiples à contexte richeClinical Reasoning Assessment in Emergency Medicine: Script Concordance Tests are MoreEfficient to Detect Clinical Experience than Rich-Context Multiple Choice Questions.Jean-Paul FOURNIER 1, 2 , Didier THIERCELIN 3 , Céline PULCINI 2 , Véronique ALUNNI-PERRET 2 ,Elise GILBERT 4 , Jean-Marc MINGUET 5 , François BERTRAND 1Résumé Contexte : La médecine d’urgence est sur le point de devenir une spécialité en France, ce qui implique l’utilisationd’outils de certification adaptés. Buts : Comparer l’aptitude des tests de concordance des scripts (TCS) et des questionsà choix multiples à contexte riche (QCM) à identifier le niveau d’expérience des cliniciens en matière de raisonnement cliniqueen médecine d’urgence. Méthode : 60 QCM et 30 TCS ont été rédigés selon les recommandations publiées et administréesà 20 résidents de première année, 16 étudiants de fin de sixième année, et à neuf médecins seniors en poste dans desservices d’urgences. L’analyse d’item des QCM a inclus la détermination des indices de difficulté et de discrimination. Lafidélité des QCM et des TCS a été mesurée par le coefficient alpha de Cronbach. Les scores obtenus aux deux épreuves parles trois groupes ont été comparés (ANOVA avec correction de Bonferoni-Dunn après vérification de l‘homogénéité desvariances par un test de Levene). Ils ont été corrélés (test de Pearson) dans le groupe des résidents. Résultats : QCM et TCSont obtenu des coefficients de fidélité corrects (respectivement 0,85 à 0,95 et 0,92 à 0,96 selon les groupes étudiés). Seuls, lesTCS ont pu identifier le niveau d’expérience des différents cliniciens. Les scores des TCS et des QCM variaient dans le mêmesens, sans corrélation significative. Ce point suggère que QCM et TCS explorent deux aspects complémentaires de la compétencemédicale. Conclusion : Le TCS paraît être un outil d’évaluation intéressant en médecine d’urgence, complémentaired’autres tests d’évaluation.Mots-clés Test de concordance de scripts ; question à choix multiples ; médecine d’urgence ; raisonnementclinique ; évaluation.Abstract Context: Emergency medicine will soon be recognized as a medical specialty in France, thus requiring efficientassessment tools. Goal: To compare the ability of Script Concordance Test (SCT) and rich-context Multiple Choice Questions(MCQ) to identify the degree of experience in emergency medicine by clinical reasoning assessment. Methods: 60 MCQ and30 SCT were prepared in respect with published guidelines and were given to 20 residents, 16 sixth year medical studentsand 9 full-time emergency physicians. Item analysis was performed for MCQ with difficulty and discrimination coefficients.Reliability for both MCQ and SCT tests was determined by a Cronbach coefficient computation. Scores were analysed forall groups by one-way ANOVA with Bonferroni’s correction for multiple comparisons after a Levene test of variance homogeneity.Pearson’s correlation coefficient was calculated for the group of residents. Results: Both MCQ and SCT were highlyreliable, with a Cronbach coefficient values ranging from 0.85 to 0.95 and 0.92 to 0.96, respectively. Degree of experiencecould only been detected from SCT scores. In the group of residents, SCT and MCQ scores varied in the same way, withoutany significant correlation. The latter observation suggests that both tests explore complementary competency areas.Conclusion: SCT appears to be a valuable assessment tool in emergency medicine, which may complement other assessmenttools.Key words Script concordance test; multiple choice questions; emergency medicine; clinical reasoning; assessment.Pédagogie Médicale 2006;7:20-3020 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1

Recherche et PerspectivesÉvaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce :les tests de concordance des scripts décèl<strong>en</strong>t mieux l’expéri<strong>en</strong>ce<strong>clinique</strong> que les questions à choix multiples à contexte richeClinical Reasoning Assessm<strong>en</strong>t in Emerg<strong>en</strong>cy Medicine: Script Concordance Tests are MoreEffici<strong>en</strong>t to Detect Clinical Experi<strong>en</strong>ce than Rich-Context Multiple Choice Questions.Jean-Paul FOURNIER 1, 2 , Didier THIERCELIN 3 , Céline PULCINI 2 , Véronique ALUNNI-PERRET 2 ,Elise GILBERT 4 , Jean-Marc MINGUET 5 , François BERTRAND 1Résumé Contexte : La médecine d’urg<strong>en</strong>ce est sur le point de dev<strong>en</strong>ir une spécialité <strong>en</strong> France, ce qui implique l’utilisationd’outils de certification adaptés. Buts : Comparer l’aptitude des tests de concordance des scripts (TCS) et des questionsà choix multiples à contexte riche (QCM) à id<strong>en</strong>tifier le niveau d’expéri<strong>en</strong>ce des clinici<strong>en</strong>s <strong>en</strong> matière de <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong><strong>en</strong> médecine d’urg<strong>en</strong>ce. Méthode : 60 QCM et 30 TCS ont été rédigés selon les recommandations publiées et administréesà 20 résid<strong>en</strong>ts de première année, 16 étudiants de fin de sixième année, et à neuf médecins s<strong>en</strong>iors <strong>en</strong> poste dans desservices d’urg<strong>en</strong>ces. L’analyse d’item des QCM a inclus la détermination des indices de difficulté et de discrimination. Lafidélité des QCM et des TCS a été mesurée par le coeffici<strong>en</strong>t alpha de Cronbach. Les scores obt<strong>en</strong>us aux deux épreuves parles trois groupes ont été comparés (ANOVA avec correction de Bonferoni-Dunn après vérification de l‘homogénéité desvariances par un test de Lev<strong>en</strong>e). Ils ont été corrélés (test de Pearson) dans le groupe des résid<strong>en</strong>ts. Résultats : QCM et TCSont obt<strong>en</strong>u des coeffici<strong>en</strong>ts de fidélité corrects (respectivem<strong>en</strong>t 0,85 à 0,95 et 0,92 à 0,96 selon les groupes étudiés). Seuls, lesTCS ont pu id<strong>en</strong>tifier le niveau d’expéri<strong>en</strong>ce des différ<strong>en</strong>ts clinici<strong>en</strong>s. Les scores des TCS et des QCM variai<strong>en</strong>t dans le mêmes<strong>en</strong>s, sans corrélation significative. Ce point suggère que QCM et TCS explor<strong>en</strong>t deux aspects complém<strong>en</strong>taires de la compét<strong>en</strong>cemédicale. Conclusion : Le TCS paraît être un outil d’évaluation intéressant <strong>en</strong> médecine d’urg<strong>en</strong>ce, complém<strong>en</strong>taired’autres tests d’évaluation.Mots-clés Test de concordance de scripts ; question à choix multiples ; médecine d’urg<strong>en</strong>ce ; <strong>raisonnem<strong>en</strong>t</strong><strong>clinique</strong> ; évaluation.Abstract Context: Emerg<strong>en</strong>cy medicine will soon be recognized as a medical specialty in France, thus requiring effici<strong>en</strong>tassessm<strong>en</strong>t tools. Goal: To compare the ability of Script Concordance Test (SCT) and rich-context Multiple Choice Questions(MCQ) to id<strong>en</strong>tify the degree of experi<strong>en</strong>ce in emerg<strong>en</strong>cy medicine by clinical reasoning assessm<strong>en</strong>t. Methods: 60 MCQ and30 SCT were prepared in respect with published guidelines and were giv<strong>en</strong> to 20 resid<strong>en</strong>ts, 16 sixth year medical stud<strong>en</strong>tsand 9 full-time emerg<strong>en</strong>cy physicians. Item analysis was performed for MCQ with difficulty and discrimination coeffici<strong>en</strong>ts.Reliability for both MCQ and SCT tests was determined by a Cronbach coeffici<strong>en</strong>t computation. Scores were analysed forall groups by one-way ANOVA with Bonferroni’s correction for multiple comparisons after a Lev<strong>en</strong>e test of variance homog<strong>en</strong>eity.Pearson’s correlation coeffici<strong>en</strong>t was calculated for the group of resid<strong>en</strong>ts. Results: Both MCQ and SCT were highlyreliable, with a Cronbach coeffici<strong>en</strong>t values ranging from 0.85 to 0.95 and 0.92 to 0.96, respectively. Degree of experi<strong>en</strong>cecould only be<strong>en</strong> detected from SCT scores. In the group of resid<strong>en</strong>ts, SCT and MCQ scores varied in the same way, withoutany significant correlation. The latter observation suggests that both tests explore complem<strong>en</strong>tary compet<strong>en</strong>cy areas.Conclusion: SCT appears to be a valuable assessm<strong>en</strong>t tool in emerg<strong>en</strong>cy medicine, which may complem<strong>en</strong>t other assessm<strong>en</strong>ttools.Key words Script concordance test; multiple choice questions; emerg<strong>en</strong>cy medicine; clinical reasoning; assessm<strong>en</strong>t.Pédagogie Médicale 2006;7:20-3020 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1


Evaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce…Pédagogie MédicaleREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MEDICALEIntro<strong>du</strong>ctionÀ l’issue d’une séqu<strong>en</strong>ce d’<strong>en</strong>seignem<strong>en</strong>t dédiée àl’acquisition de compét<strong>en</strong>ces <strong>clinique</strong>s, l’évaluation desappr<strong>en</strong>tissages des étudiants doit vérifier leur maîtrised’un corpus de connaissances spécifiques ainsi que leurcapacité à les réutiliser dans les conditions prévisibles deleur exercice professionnel, au service <strong>du</strong> processus de<strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> face à des problèmes de santéreprés<strong>en</strong>tatifs de ceux auxquels ils seront exposés 1, 2 .Avec la création <strong>du</strong> diplôme d’études supérieures complém<strong>en</strong>taires(DESC), la médecine d’urg<strong>en</strong>ce est sur le pointde dev<strong>en</strong>ir une discipline spécialisée <strong>en</strong> France, ce quiimplique l’utilisation d’outils de certification adaptés.Les questions à choix multiples (QCM) sont largem<strong>en</strong>tutilisées dans cette optique, au point de représ<strong>en</strong>ter unepart importante des épreuves utilisées pour l’accréditationdes candidats par l’American Board of Emerg<strong>en</strong>cyMedicine (ABEM). Il s’agit de QCM à contexte riche,explorant non pas la simple acquisition de connaissances,mais leur application contextualisée 3 . De ce fait,elles exig<strong>en</strong>t de l’étudiant un niveau cognitif élevé 3 .Bi<strong>en</strong> qu’ils soi<strong>en</strong>t peu familiers de ce format de questions,il a été montré que les étudiants français atteignai<strong>en</strong>t unniveau de performance à peine inférieur à celui d’étudiantsaméricains de niveau d’études équival<strong>en</strong>t 4 .Récemm<strong>en</strong>t décrit, le test de concordance des scripts(TCS) permet d’explorer le <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> comparantl’utilisation que font des novices d’une informationmédicale à celle qu’<strong>en</strong> ferai<strong>en</strong>t des experts confrontés aumême problème 5, 6 . Surtout, il permet d’analyser le <strong>raisonnem<strong>en</strong>t</strong><strong>en</strong> contexte d’incertitude 7, 8 , ce qui r<strong>en</strong>force sa pertin<strong>en</strong>ce<strong>en</strong> médecine d’urg<strong>en</strong>ce où le médecin est régulièrem<strong>en</strong>tconfronté à des situations complexes et floues, à gérerdans un temps court et avec des moy<strong>en</strong>s limités. Il reposesur la théorie des scripts comme modèle d’organisation desconnaissances 9 . Il a été utilisé avec succès <strong>en</strong> chirurgie 10 ,gynécologie 7 , radiologie 11 et urologie 12 . Ces deux aspects dela compét<strong>en</strong>ce <strong>clinique</strong> – application contextualisée desconnaissances et <strong>raisonnem<strong>en</strong>t</strong> <strong>en</strong> situation d’incertitude –sont complém<strong>en</strong>taires.De manière générale, un exam<strong>en</strong> permet de transformerune performance observée <strong>en</strong> score mesurable 1 . À cetitre, il doit être valide, fidèle et réalisable 1 . Explorant le<strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong>, dont la pertin<strong>en</strong>ce est indissociablede l’expéri<strong>en</strong>ce <strong>clinique</strong> <strong>clinique</strong>, le TCS devraitpouvoir distinguer les clinici<strong>en</strong>s <strong>en</strong> fonction de leurniveau d’expéri<strong>en</strong>ce. À l’inverse, ni les QCM 13 , ni lesépreuves rédactionnelles 14 ne permett<strong>en</strong>t de distinguerrégulièrem<strong>en</strong>t les clinici<strong>en</strong>s <strong>en</strong> fonction de leur niveaud’expéri<strong>en</strong>ce. Enfin, explorant le même domaine deconnaissances, ces deux formats devrai<strong>en</strong>t con<strong>du</strong>ire àl’obt<strong>en</strong>tion de scores positivem<strong>en</strong>t corrélés.Nous avons utilisé le TCS pour évaluer les appr<strong>en</strong>tissagesdes étudiants à l’issue d’un <strong>en</strong>seignem<strong>en</strong>t optionnelde médecine d’urg<strong>en</strong>ce destiné aux résid<strong>en</strong>ts. Les objectifsde ce travail étai<strong>en</strong>t de vérifier les caractéristiquesintrinsèques <strong>du</strong> TCS (validité, fidélité, et faisabilité), deconfirmer son aptitude à id<strong>en</strong>tifier les experts (ce quiserait à mettre au crédit de sa validité 1 ) et <strong>en</strong>fin de vérifierla corrélation des scores obt<strong>en</strong>us au TCS et auxQCM.Matériel et méthodesL’exercice de responsabilités <strong>en</strong> service d’urg<strong>en</strong>ces <strong>en</strong>France est actuellem<strong>en</strong>t subordonné à l’obt<strong>en</strong>tion d’undiplôme universitaire. Le service des urg<strong>en</strong>ces <strong>du</strong>C<strong>en</strong>tre Hospitalier Universitaire (CHU) de Nice organisedepuis 1995 un <strong>en</strong>seignem<strong>en</strong>t optionnel de médecined’urg<strong>en</strong>ce [Diplôme Universitaire de Médecined’Urg<strong>en</strong>ce (DUMU)] ouvert aux résid<strong>en</strong>ts, d’une <strong>du</strong>réed’une année, constitué d’<strong>en</strong>seignem<strong>en</strong>ts théoriques sousforme de séminaires m<strong>en</strong>suels, d’<strong>en</strong>seignem<strong>en</strong>ts pratiquessous forme d’ateliers (gestes techniques, etc.) et destages dans des unités accréditées.Préparation des questionsLes questions utilisées pour l’exam<strong>en</strong> organisé à l’issue<strong>du</strong> DUMU ont été sélectionnées à partir d’un thésaurusde situations <strong>clinique</strong>s r<strong>en</strong>contrées dans le service d’accueildes urg<strong>en</strong>ces <strong>du</strong> CHU de Nice, constitué <strong>en</strong> 2000et regroupant 9 523 dossiers. Ce service possède deuxunités satellites, pr<strong>en</strong>ant <strong>en</strong> charge directem<strong>en</strong>t lesurg<strong>en</strong>ces traumatologiques et psychiatriques. Les<strong>en</strong>fants et les pati<strong>en</strong>tes souffrant d’affections gynécoobstétricalessont accueillis sur un autre site. Les critèresde choix des situations ret<strong>en</strong>ues ont été : fréqu<strong>en</strong>ce et1- Médecine Générale d’Urg<strong>en</strong>ce - Hôpital Saint Roch - CHU Nice, France2- Départem<strong>en</strong>t de Pédagogie Médicale - Faculté de Médecine de Nice Sophia Antipolis - France3- Service d’Aide médicale urg<strong>en</strong>te (SAMU 06) - CHU Nice - France4- Service d’Accueil des Urg<strong>en</strong>ces - Hôpital de Cannes - France5- Service d’Accueil des Urg<strong>en</strong>ces - Hôpital de Draguignan - FranceCorrespondance : Jean-Paul Fournier - Départem<strong>en</strong>t de Pédagogie médicale - Faculté de Médecine (Université de Nice Sophia Antipolis)28 Av<strong>en</strong>ue de Valombrose - 06107 Nice cedex 2 - France - Téléphone : + (4) 93 37 77 77 - Mailto:fournier.jp@chu-nice.frREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MÉDICALE21


Recherche et Perspectivesgravité, par exemple : insuffisance cardiaque congestive,décomp<strong>en</strong>sation de broncho-pneumopathie chroniqueobstructive pour les situations fréqu<strong>en</strong>tes ; dissectionaortique, fissuration d’anévrysme de l’aorte abdominalepour les situations graves. Elles ont été sélectionnées parun panel de quatre experts, qui ont privilégié con<strong>du</strong>itesdiagnostiques et thérapeutiques de façon équilibréepour l’élaboration des QCM et <strong>du</strong> TCS.Les QCM ont été rédigées selon les recommandations<strong>du</strong> National Board of Medical Examiners (NBME) 3 etn’ont inclus que des questions dites de type C (qui propos<strong>en</strong>tà l’étudiant la meilleure réponse et quatre distracteurs).Elles ont été soumises à trois experts pourvalidation : validité sci<strong>en</strong>tifique, abs<strong>en</strong>ce d’ambiguïtédes intitulés, vérification <strong>du</strong> caractère incontestable dela réponse ret<strong>en</strong>ue. Soixante QCM, toutes indép<strong>en</strong>dantesles unes des autres, ont été rédigées. Toutes avai<strong>en</strong>t lemême poids pour l’attribution des indices numériquescontributifs au score : 1 si la bonne réponse était ret<strong>en</strong>ue,0 sinon. Un exemple est fourni <strong>en</strong> annexe 1.Les vignettes <strong>du</strong> TCS ont été rédigées selon les recommandationsde Charlin 5, 6 . Le processus de préparationet d’établissem<strong>en</strong>t des scores est illustré <strong>en</strong> annexe 2.Brièvem<strong>en</strong>t, chaque vignette prés<strong>en</strong>te un scénario<strong>clinique</strong> court à partir <strong>du</strong>quel peuv<strong>en</strong>t être formuléesplusieurs hypothèses pertin<strong>en</strong>tes, diagnostiques ou thérapeutiques(colonne 1). Une information supplém<strong>en</strong>taire(<strong>clinique</strong>, résultat de biologie, …) est alors disponible(colonne 2), dont l’intérêt pour l’hypothèse discutéeest apprécié sur une échelle de Likert de -2 à +2(colonne 3). Les vignettes <strong>clinique</strong>s correspondai<strong>en</strong>t àdes situations ret<strong>en</strong>ues par les quatre mêmes experts, quiont égalem<strong>en</strong>t validé les hypothèses diagnostiques outhérapeutiques et les informations supplém<strong>en</strong>tairesfournies. Elles ont été soumises à un panel de neufautres experts qui ont attribué indivi<strong>du</strong>ellem<strong>en</strong>t à chaqueinformation un score de -2 à +2 <strong>en</strong> fonction deleurs poids respectifs sur leur décision médicale. Cegroupe d’experts était constitué de pratici<strong>en</strong>s, <strong>en</strong>seignantset/ou occupant des responsabilités dans les services d’urg<strong>en</strong>cesde la région depuis au moins cinq ans et était distinct<strong>du</strong> groupe de s<strong>en</strong>iors défini plus loin. Le score choisia été transformé <strong>en</strong> crédit <strong>en</strong> divisant le nombre d’expertsattribuant un même score par le nombre d’experts ayantret<strong>en</strong>u le score le plus choisi (par conv<strong>en</strong>tion on attribueun crédit de 1 à ce score). Le processus d’établissem<strong>en</strong>t desscores est illustré <strong>en</strong> annexe 2. Le score <strong>du</strong> test correspondà la somme des scores obt<strong>en</strong>us à chaque item. Ce principecorrespond à l’établissem<strong>en</strong>t de scores combinés (aggregatescoring method) 15 .Le TCS a été composé de 30 situations <strong>clinique</strong>s, toutesindép<strong>en</strong>dantes les unes des autres, comportant chacunetrois items, soit 90 items <strong>en</strong> tout. Deux QCM et deuxitems <strong>du</strong> TCS ont été réécrits <strong>en</strong> raison d’une formulationimparfaite des questions. Aucun n’a été contestépour sa valeur sci<strong>en</strong>tifique. Le ratio de questions diagnostiqueset thérapeutiques était similaire dans les deuxépreuves (0,44 vs 0,53, p = NS). La préparation del’exam<strong>en</strong> a <strong>du</strong>ré trois semaines <strong>en</strong>viron. Il a été administré<strong>en</strong> juin 2003. L’épreuve a <strong>du</strong>ré 2h30.Validation de l’exam<strong>en</strong>Le test par QCM a été soumis à une analyse d’itemsavec détermination des indices de difficulté (valeur p :proportion de participants répondant correctem<strong>en</strong>t àune question donnée) et de discrimination (r.bis : coeffici<strong>en</strong>tde corrélation bisériale de points 16 ). Les itemspossédant un indice de difficulté ou de corrélationinsuffisants ont été revus ultérieurem<strong>en</strong>t pour validationdéfinitive.La consistance interne des deux tests a été mesurée parle coeffici<strong>en</strong>t α de Cronbach 17 qui doit être au moinségal à 0,80 pour garantir une fidélité correcte 18 .Populations étudiéesTrois groupes de niveaux d’expéri<strong>en</strong>ce croissante ont étédéfinis et comparés :– étudiants : il s’agissait de 16 étudiants volontairesv<strong>en</strong>ant de valider la sixième année des études médicales etdésireux de s’inscrire au DUMU. Ils ont été recrutés lorsde l’<strong>en</strong>treti<strong>en</strong> de pré inscription <strong>en</strong> septembre 2003 ;– résid<strong>en</strong>ts : il s’agissait des 20 résid<strong>en</strong>ts de premièreannée inscrits au DUMU au titre de l’année universitaire2002 – 2003 ;– s<strong>en</strong>iors : il s’agissait de neuf médecins volontaires <strong>en</strong>poste dans le service des urg<strong>en</strong>ces de la région ou y effectuantrégulièrem<strong>en</strong>t des gardes de s<strong>en</strong>iors. Aucunn‘appart<strong>en</strong>ait au groupe des experts. Six d’<strong>en</strong>tre euxétai<strong>en</strong>t titulaires <strong>du</strong> DUMU. Tous avai<strong>en</strong>t au moinscinq années d’expéri<strong>en</strong>ce professionnelle avec prise deresponsabilités. Ils ont été placés dans les mêmes conditionsde rédaction que les étudiants et les résid<strong>en</strong>ts.Analyse statistiqueLes scores obt<strong>en</strong>us aux deux tests par les trois catégoriesde pratici<strong>en</strong>s – étudiants, résid<strong>en</strong>ts, s<strong>en</strong>iors – ont étéram<strong>en</strong>és à 100. Compte t<strong>en</strong>u de la faiblesse des effectifs,l’homogénéité des variances des scores obt<strong>en</strong>us auxdeux tests a été vérifiée par un test de Lev<strong>en</strong>e. Les scoresobt<strong>en</strong>us à chacun des tests par les trois groupes ont étécomparés par une analyse de variance (ANOVA) avec22 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1


Evaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce…Pédagogie MédicaleREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MEDICALEcorrection post hoc par la méthode de Bonferoni-Dunnpour limiter l’effet <strong>du</strong> hasard.La corrélation <strong>en</strong>tre les scores obt<strong>en</strong>us aux QCM et auTCS a été étudiée par le test de Pearson pour les résid<strong>en</strong>tsauxquels est destiné cet <strong>en</strong>seignem<strong>en</strong>t. La significativitéa été définie pour p < 0,05.Les calculs ont été effectués avec le logiciel StatView5.0® pour Macintosh®.RésultatsRésultats <strong>du</strong> TCSLes scores obt<strong>en</strong>us au TCS par les trois groupes étudiéssont résumés sur le tableau 1. Les étudiants ont obt<strong>en</strong>ules scores les plus faibles, les s<strong>en</strong>iors les scores les plusélevés, les résid<strong>en</strong>ts se situant <strong>en</strong>tre les deux. Il existaitune différ<strong>en</strong>ce très significative <strong>en</strong>tre les scores obt<strong>en</strong>uspar les étudiants et ceux des résid<strong>en</strong>ts (50,26 ± 6,29 vs55,80 ± 5,31, p = 0,0055) et <strong>en</strong>tre ceux des étudiants etdes s<strong>en</strong>iors (50,26 ± 6,29 vs 59,85 ± 4,14, p = 0,0002).Etudiants et résid<strong>en</strong>ts ont prés<strong>en</strong>té la variabilité des scoresla plus importante. Ces résultats sont résumés sur lafigure 1. La consistance interne <strong>du</strong> test était très correcte,le coeffici<strong>en</strong>t a étant compris <strong>en</strong>tre 0,85 (s<strong>en</strong>iors)et 0,95 (étudiants).Résultats des QCMUn seul item a été éliminé à l’issue de la revue des itemsdéfici<strong>en</strong>ts. Le calcul <strong>du</strong> score a donc porté sur 59 items.Les scores obt<strong>en</strong>us sont résumés sur le tableau 2. Lesrésid<strong>en</strong>ts ont obt<strong>en</strong>u le score moy<strong>en</strong> le plus élevé (59,15± 8,93). Il n’y avait cep<strong>en</strong>dant aucune différ<strong>en</strong>ce significativelors de la comparaison des scores obt<strong>en</strong>us par lestrois groupes étudiés. Là <strong>en</strong>core, ce sont les étudiants etles résid<strong>en</strong>ts qui prés<strong>en</strong>tai<strong>en</strong>t la plus grande variabilitédes scores. Ces résultats sont représ<strong>en</strong>tés sur la figure 2.La consistance interne <strong>du</strong> test était très correcte, le coeffici<strong>en</strong>ta se situant <strong>en</strong>tre 0,92 et 0,96 (tableau 2).Corrélation des scores au TCS et aux QCMLes scores obt<strong>en</strong>us au TCS et aux QCM par les résid<strong>en</strong>tsvariai<strong>en</strong>t dans le même s<strong>en</strong>s, sans que l’on puissemettre <strong>en</strong> évid<strong>en</strong>ce une corrélation significative sur lafigure 3 (R2 = 0,0164 ; p = 0,5905).Tableau 1 :Scores obt<strong>en</strong>us par les différ<strong>en</strong>tes populations évaluées au test de concordance de scriptsEffectif Moy<strong>en</strong>ne Maximum Minimum SD αEtudiants 16 50,26 56,76 29,54 6,29 0,95Résid<strong>en</strong>ts 20 55,80 68,83 47,69 5,31 0,87S<strong>en</strong>iors 9 59,85 67,38 53,01 4,14 0,85SD : déviation standard - α : coeffici<strong>en</strong>t de CronbachREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MÉDICALE23


Recherche et PerspectivesFigure 1 :Scores (sur 100) obt<strong>en</strong>us par les différ<strong>en</strong>tes populations au test de concordance des scriptsScores au test de concordance des scripts70656055504540Etudiants Résid<strong>en</strong>ts S<strong>en</strong>iorsTableau 2 :Scores obt<strong>en</strong>us par les différ<strong>en</strong>tes populations évaluées aux questions à choix multipleEffectif Moy<strong>en</strong>ne Maximum Minimum SD αEtudiants 16 54,66 69,49 37,29 10,75 0,92Résid<strong>en</strong>ts 20 59,15 74,58 44,07 8,93 0,96S<strong>en</strong>iors 9 58,19 64,41 50,85 5,08 0,93SD : déviation standard - α : coeffici<strong>en</strong>t de Cronbach24 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1


Evaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce…Pédagogie MédicaleREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MEDICALEFigure 2 :Scores (sur 100) obt<strong>en</strong>us par les différ<strong>en</strong>tes populations aux questions à choix multipleScores aux questions à choix multiple70656055504540Etudiants Résid<strong>en</strong>ts S<strong>en</strong>iorsFigure 3 :Analyse de la corrélation des scores (sur 100) obt<strong>en</strong>us par les résid<strong>en</strong>ts au testde concordance des scripts (TCS) et aux questions à choix multiples (QCM)y = 0,0761x + 51,303R 2 = 0,0164p = 0,5905REVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MÉDICALE25


Recherche et PerspectivesDiscussionLes QCM n’ont pu distinguer le niveau d’expéri<strong>en</strong>ce <strong>clinique</strong>des trois catégories de clinici<strong>en</strong>s évalués. Comme onpouvait s’y att<strong>en</strong>dre, ce sont les résid<strong>en</strong>ts, qui v<strong>en</strong>ai<strong>en</strong>t debénéficier de l’<strong>en</strong>seignem<strong>en</strong>t, qui ont obt<strong>en</strong>u les scores lesplus élevés. Les étudiants ont eu les scores les plus faibles,sans que l’on puisse mettre <strong>en</strong> évid<strong>en</strong>ce une différ<strong>en</strong>ce significative<strong>en</strong>tre leurs résultats et ceux des résid<strong>en</strong>ts et dess<strong>en</strong>iors. Étudiants et résid<strong>en</strong>ts prés<strong>en</strong>tai<strong>en</strong>t la variabilité laplus élevée des scores. Ce point, joint à la faiblesse des effectifs,peut expliquer que ces différ<strong>en</strong>ces n’ai<strong>en</strong>t pas été significatives.Les s<strong>en</strong>iors ont obt<strong>en</strong>u des scores intermédiaires.Là <strong>en</strong>core, ces résultats étai<strong>en</strong>t att<strong>en</strong><strong>du</strong>s, les QCM 13 , commed’ailleurs les questions rédactionnelles 14 , pouvant ne pas distinguerles s<strong>en</strong>iors des juniors (étudiants, résid<strong>en</strong>ts).À l’inverse, le TCS a pu distinguer les trois catégories declinici<strong>en</strong>s, <strong>en</strong> fonction de leur degré d’expéri<strong>en</strong>ce, lesétudiants obt<strong>en</strong>ant les scores les plus faibles, les s<strong>en</strong>iorsles scores les plus élevés et les résid<strong>en</strong>ts des scores intermédiaires.Il existait une différ<strong>en</strong>ce significative <strong>en</strong>tre lesscores obt<strong>en</strong>us d’une part, par les étudiants et les résid<strong>en</strong>tset, d’autre part, <strong>en</strong>tre ceux des résid<strong>en</strong>ts et dess<strong>en</strong>iors. Ces résultats confirm<strong>en</strong>t les résultats observésdans d’autres disciplines spécialisées 7, 10 – 12 .L’exam<strong>en</strong> a été soigneusem<strong>en</strong>t construit, <strong>en</strong> termes de validitéset de fidélité. Il a été préparé <strong>en</strong> trois semaines <strong>en</strong>vironpar un seul <strong>en</strong>seignant. Les QCM utilisées dans ce travailont été rédigées à partir d’un corpus de situationsqu’auront à gérer les médecins <strong>en</strong> poste dans un serviced’urg<strong>en</strong>ces. Elles ont été rédigées selon les recommandations<strong>du</strong> NBME 3 , revues par trois experts pour leurcont<strong>en</strong>u sci<strong>en</strong>tifique et la précision de leur intitulé. Enfin,elles ont fait l’objet d’une analyse d’item à l’issue del’épreuve. De fait, elles étai<strong>en</strong>t conformes aux normes <strong>du</strong>NBME 19 . Ce point garantit leur validité appar<strong>en</strong>te 1 . L<strong>en</strong>ombre des questions assure la validité de cont<strong>en</strong>u del’épreuve 1 . Enfin, elles sont conformes à l’exercice futurdes médecins formés, ce qui conditionne la validité deconstruit de l’épreuve 1, 20 . Les coeffici<strong>en</strong>ts alpha deCronbach (0,92 et 0,96 selon les groupes) garantiss<strong>en</strong>t laconsistance interne de l’épreuve 18 . Les questions ret<strong>en</strong>uespour le TCS ont été construites à partir <strong>du</strong> même corpusde situations <strong>clinique</strong>s, sélectionnées par les mêmesexperts. Ils ont revu les vignettes <strong>clinique</strong>s et les items ret<strong>en</strong>uspour <strong>en</strong> garantir la validité sci<strong>en</strong>tifique et l’abs<strong>en</strong>ced’ambiguïté. Les différ<strong>en</strong>ts niveaux d’ancrage des échellesde Likert (voir annexe 2) ont été tirés de l’article deCharlin 6 . De ce fait, la validité appar<strong>en</strong>te de cette épreuveest atteinte. La validité de cont<strong>en</strong>u est garantie par le nombrede questions utilisées 1 . Enfin, les coeffici<strong>en</strong>ts alpha deCronbach obt<strong>en</strong>us (0,85 à 0,95 selon les groupes) garantiss<strong>en</strong>tla consistance interne de l’épreuve 18 . Les deuxépreuves apparaissai<strong>en</strong>t donc valides et fidèles. Ellesexplorai<strong>en</strong>t le même corpus de connaissances ; il paraissaitdonc intéressant de les comparer.Les scores obt<strong>en</strong>us aux deux épreuves ont été comparéschez les résid<strong>en</strong>ts auxquels cet <strong>en</strong>seignem<strong>en</strong>t est destiné.Il aurait été logique d’observer une corrélation, mêmefaible, <strong>en</strong>tre les scores obt<strong>en</strong>us aux deux épreuves. Eneffet, utilisation de connaissances factuelles <strong>en</strong> situation<strong>clinique</strong> (QCM) et <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> (TCS) portantsur le même corpus de situations sont a priori liés.Les scores variai<strong>en</strong>t dans le même s<strong>en</strong>s, mais il n’a pasété possible de mettre <strong>en</strong> évid<strong>en</strong>ce la corrélation statistiquem<strong>en</strong>tsignificative att<strong>en</strong><strong>du</strong>e <strong>en</strong>tre leurs valeurs.L’effectif limité <strong>du</strong> groupe peut certes expliquer cesrésultats. Surtout, la revue des questions utilisées pourles deux épreuves a montré que, si elle étai<strong>en</strong>t bi<strong>en</strong> issues<strong>du</strong> même corpus de situations <strong>clinique</strong>s, avec la mêmerépartition <strong>en</strong>tre situations de prise de décisions diagnostiquesou thérapeutiques, elles n’étai<strong>en</strong>t pas id<strong>en</strong>tiques<strong>en</strong> termes de répartition d’une spécialité à l’autre(métabolique, gastro<strong>en</strong>térologie, etc.). Il est possibleque, si les questions avai<strong>en</strong>t exploré exactem<strong>en</strong>t lemême champ de connaissances, la corrélation ait étéstatistiquem<strong>en</strong>t significative.Le TCS permet de mesurer le degré d’organisation desconnaissances et leur niveau d’élaboration. Il vise àmesurer l’adéquation des li<strong>en</strong>s au sein des connaissances<strong>clinique</strong>s bi<strong>en</strong> plus que la simple prés<strong>en</strong>ce d’élém<strong>en</strong>ts deconnaissances 6, 9 . Un des avantages fondam<strong>en</strong>taux <strong>du</strong>TCS est qu’il intègre le contexte d’incertitude dans laprise de décision, qu’elle soit diagnostique ou thérapeutique7, 8 . L’appréciation de l’incertitude ou de l’abs<strong>en</strong>cede cons<strong>en</strong>sus est r<strong>en</strong><strong>du</strong>e possible par le mode de calculdes scores faisant appel aux scores composites 7 . Le principede tels scores est de pondérer la réponse (ce qui correspondici à l’échelle de Likert) et d’obt<strong>en</strong>ir le scorefinal <strong>en</strong> additionnant les scores de chaque item 15 . Unetelle approche permet <strong>en</strong> outre de limiter l’erreur demesure 15 et de mieux distinguer experts et novices 7 .La gestion de l’incertitude est commune <strong>en</strong> médecined’urg<strong>en</strong>ce où l’on traite régulièrem<strong>en</strong>t des situationsfloues, correspondant souv<strong>en</strong>t à des syndromes ou dessymptômes (douleur thoracique, dyspnée,etc.) plutôtque des <strong>en</strong>tités <strong>clinique</strong>s bi<strong>en</strong> définies (infarctus <strong>du</strong>myocarde, pneumonie communautaire, etc.), dans untemps et avec des moy<strong>en</strong>s limités. La gestion de l’incertitude<strong>en</strong> <strong>clinique</strong> explique <strong>en</strong> partie le peu d’<strong>en</strong>train desclinici<strong>en</strong>s à appliquer les recommandations de bonne pratique<strong>clinique</strong> 21 . Cette situation n’est pas exceptionnelle26 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1


Evaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce…Pédagogie MédicaleREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MEDICALE<strong>en</strong> médecine d’urg<strong>en</strong>ce où l’on observe par exemple prèsde 30 % d’inadéquation avec les recommandations deprise <strong>en</strong> charge diagnostique de l’embolie pulmonaire 22ou plus de 40 % d’inadéquation de la prescription del’antibiothérapie lors de la prise <strong>en</strong> charge des pneumoniescommunautaires 23 . À ce titre, le TCS constituedonc un outil d’évaluation conceptuellem<strong>en</strong>t sé<strong>du</strong>isant<strong>en</strong> médecine d’urg<strong>en</strong>ce et, au-delà, aux autres domainesmédicaux.Une autre limite importante de ce travail est représ<strong>en</strong>téepar la taille et la composition des groupes de s<strong>en</strong>iors, derésid<strong>en</strong>ts et d’étudiants. Le groupe des résid<strong>en</strong>ts est, sansdoute, représ<strong>en</strong>tatif des candidats à cet <strong>en</strong>seignem<strong>en</strong>tqui sont tous des résid<strong>en</strong>ts de première année, depuisque cet <strong>en</strong>seignem<strong>en</strong>t existe. En revanche, les groupesde s<strong>en</strong>iors et d’étudiants ont été constitués de volontairesqui, eux, ne sont pas forcém<strong>en</strong>t représ<strong>en</strong>tatifs dess<strong>en</strong>iors exerçant des responsabilités <strong>en</strong> service d’urg<strong>en</strong>ceou des étudiants <strong>en</strong> fin de cursus. Le type même <strong>du</strong>recrutem<strong>en</strong>t <strong>du</strong> service d’urg<strong>en</strong>ce <strong>du</strong> CHU de Nice alimité les questions portant sur des situations et problèmespsychiatriques, traumatologiques, pédiatriques ou gynécologiques,pas ou peu représ<strong>en</strong>tés dans le thésaurus qui aservi de base à la rédaction des questions utilisées pour lesdeux épreuves.À ces restrictions prés, nos résultats suggèr<strong>en</strong>t une complém<strong>en</strong>tarité<strong>en</strong>tre QCM à contexte riche et TCS pourl’évaluation d’un <strong>en</strong>seignem<strong>en</strong>t de médecine d’urg<strong>en</strong>ce.Ce point est particulièrem<strong>en</strong>t intéressant au mom<strong>en</strong>t où lamédecine d’urg<strong>en</strong>ce devi<strong>en</strong>t une discipline spécialiséeautonome <strong>en</strong> France. D’autres tests comme les stationsd’exam<strong>en</strong> <strong>clinique</strong> objectif structuré (ECOS) permett<strong>en</strong>td’évaluer des aspects plus techniques ou relationnels de lacompét<strong>en</strong>ce <strong>clinique</strong> 2 . Ils sont égalem<strong>en</strong>t complém<strong>en</strong>tairesdes TCS 10 , dans une approche globale de l’évaluationde l’acquisition de la compét<strong>en</strong>ce <strong>clinique</strong> <strong>en</strong> <strong>en</strong>seignem<strong>en</strong>tmédical 24 .Remerciem<strong>en</strong>tsNous remercions le Pr Bernard Charlin d’avoir accepté larelecture de la première version <strong>du</strong> manuscrit. Nous remercionsles étudiants et les médecins qui ont participé à cetteétude.ContributionsJean-Paul Fournier a conçu l’étude, rédigé les questions,corrigé l’exam<strong>en</strong> et rédigé le manuscrit. DidierThiercelin, Élise Gilbert, Jean-Marc Minguet etFrançois Bertrand ont sélectionné les situations <strong>clinique</strong>s,revu et critiqué les questions. Céline Pulcini etVéronique Alunni-Perret ont revu le manuscrit.Annexe 1 :Exemple de QCM à contexte richeUne femme de 24 ans se prés<strong>en</strong>te aux urg<strong>en</strong>ces pour céphalées. Elles sont apparues brutalem<strong>en</strong>t, de siège rétroorbitaire,avec des nausées et un épisode de vomissem<strong>en</strong>t. Le bruit et la lumière sont très pénibles. Elle a prissans succès 6 gélules de paracétamol (Dafalgan ® ). Elle vi<strong>en</strong>t de comm<strong>en</strong>cer un traitem<strong>en</strong>t par gestodène,éthinylestradiol (Méliane ® ). Ses seuls antécéd<strong>en</strong>ts notables sont constitués par des sinusites maxillaires à répétitionet une allergie au triméthoprime sulfaméthoxazole (Bactrim ® ). Elle est actuellem<strong>en</strong>t traitée parroxythromycine (Rulid ® ). La température est à 37,8°C. L’exam<strong>en</strong> neurologique est normal. La nuque estsouple. Quelle est la prochaine étape de la prise <strong>en</strong> charge ?A- Injection de kétoprofène (Profénid ® )B- Injection de morphineC- Injection de paracétamol (Perfalgan ® )D- Perfusion de dihydro ergotamineE- Pulvérisation nasale de sumatriptan (Imigrane ® )REVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MÉDICALE27


Recherche et PerspectivesAnnexe 2 :Réalisation d’un test de concordance de scriptsRédaction de la vignette <strong>clinique</strong> et des items (étape 1), soumission à neuf experts qui attribu<strong>en</strong>t une note de-2 à +2 à la nouvelle information (seconde colonne) <strong>en</strong> fonction <strong>du</strong> poids qu’ils lui accord<strong>en</strong>t(étape 2). La note est transformée <strong>en</strong> crédit pour l’item <strong>en</strong> divisant le nombre d’experts ayant choisi une valeurparticulière par le nombre d’experts ayant choisi la valeur la plus sélectionnée (étape 3) : pour I1 : -2 est lavaleur la plus choisie, par 4 experts : -2 donne un crédit de 1 (1 = 4/4), -1 est choisie par 3 experts, elle donneun crédit de 0,75 (0,75 = 3/4), 0 est choisie par 2 experts, elle donne un crédit de 0,5 (0,5 = 2/4). 1 et 2 n’ontpas été choisies et donn<strong>en</strong>t donc un crédit de 0. Les étudiants (R1 à R8) répond<strong>en</strong>t aux mêmes questions :leurs choix de valeurs (étape 4) est transformé <strong>en</strong> score (étape 5) à partir <strong>du</strong> score établi par les experts. Le scoretotal est la somme <strong>du</strong> score de chaque item.Étape 1 : rédaction de la vignette <strong>clinique</strong> et des trois items (I1 à I3) :Une pati<strong>en</strong>te de 65 ans est adressée par une <strong>clinique</strong> pour suspicion d’embolie pulmonaire. Elle a des antécéd<strong>en</strong>tsde diabète, d’insuffisance cardiaque et de broncho-pneumopathie chronique obstructive.Si vous p<strong>en</strong>siez faire(option d’exam<strong>en</strong> complém<strong>en</strong>taire)Un angioscanner thoracique (I1)Un dosage des D dimères (I2)Et qu’alors vous trouvez(nouvelle information obt<strong>en</strong>uepar exam<strong>en</strong> <strong>clinique</strong> ou exam<strong>en</strong> complém<strong>en</strong>taire)Un traitem<strong>en</strong>t par metformine(Glucophage retard ® )Un cancer de l’ovaire<strong>en</strong> cours de traitem<strong>en</strong>tL’effet sur la nécessité dedemander ce test est le suivant-2 -1 0 +1 +2-2 -1 0 +1 +2Un écho-Doppler veineux (I3) Un signe de Homans -2 -1 0 +1 +2-2 : absolum<strong>en</strong>t contre-indiqué 0 : non pertin<strong>en</strong>t +1 : utile et souhaitable-1 : peu utile ou plutôt néfaste dans cette situation +2 : indisp<strong>en</strong>sableÉtape 2 : attribution des scores par les experts : nombre d’experts ayant respectivem<strong>en</strong>t attribué chacune desnotes pour chaque itemQ1-2 -1 0 +1 +2I1 4 3 2 0 0I2 0 1 4 3 1I3 0 1 4 3 128 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1


Evaluation <strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong> <strong>en</strong> médecine d’urg<strong>en</strong>ce…Pédagogie MédicaleREVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MEDICALEÉtape 3 : attribution <strong>du</strong> crédit pour l’itemQ1-2 -1 0 1 2I1 1 0,75 0,5 0 0I2 0 0,25 1 0,75 0,25I3 0 0,25 1 0,75 0,25Étape 4 : établissem<strong>en</strong>t <strong>du</strong> score des candidats (1)Q1R1 R2 R3 R4 R5 R6 R7 R8I1 -2 2 -1 0 -2 -2 -2 2I2 2 1 1 1 2 2 0 2I3 2 2 1 1 -1 0 2 2Étape 5 : établissem<strong>en</strong>t <strong>du</strong> score des candidats (2)R1 R2 R3 R4 R5 R6 R7 R8I1 1 0 0,75 0,5 1 1 1 0Q1 I2 0,25 0,75 0,75 0,75 0,25 0,25 1 0,25I3 0,25 0,25 0,75 0,75 0,25 1 0,25 0,25Total 1,5 1,0 2,25 2,0 1,50 2,25 2,25 0,5Référ<strong>en</strong>ces1. Jean P, Des Marchais J, Delorme J. Appr<strong>en</strong>dre à <strong>en</strong>seignerles sci<strong>en</strong>ces de la santé. Cahier 4, Sherbrooke:Université De Sherbrooke, 1993.2. Epstein RM, Hundert EM. Defining and assessingprofessional compet<strong>en</strong>ce. JAMA 2002;287:226-35.3. Case SM, Swanson DB. Constructing writt<strong>en</strong> testquestions for basic and clinical sci<strong>en</strong>ces 3rd edition,Philadelphia: The National Board of MedicalExaminers, 2001.4. Fournier JP, De Champlain AF, B<strong>en</strong>chimol D, et al.Intérêt de transposer un exam<strong>en</strong> américain dans lecadre <strong>du</strong> futur exam<strong>en</strong> national classant validantfrançais. Ann Med Interne 2003;154:148-56.5. Charlin B, Roy L, Brailowsky C, Goulet F, Van DerVleut<strong>en</strong> C. The script concordance test : a tool to assessthe reflective clinician. Teach Learn Med 2000;4:189-95.6. Charlin B, Gagnon R, Sibert L, Van Der Vleut<strong>en</strong> C.Le test de concordance de script, un instrum<strong>en</strong>t d’évaluation<strong>du</strong> <strong>raisonnem<strong>en</strong>t</strong> <strong>clinique</strong>. Pédagogie Médicale2002;3:135-44.7. Charlin B, Desaulniers M, Gagnon R, Blouin D, VanDer Vleut<strong>en</strong> C. Comparison of an aggregate scoringmethod with a cons<strong>en</strong>sus scoring method in a measureof clinical reasoning capacity. Teach Learn Med2002;14:150-6.REVUE INTERNATIONALE FRANCOPHONE D’ÉDUCATION MÉDICALE29


Recherche et Perspectives8. Charlin B, Van Der Vleut<strong>en</strong> C. Standardized assessm<strong>en</strong>tin context of uncertainty : the script concordanceapproach. Evaluation and the Health Professions2004;27:304-19.9. Charlin B, Tardif J, Boshuiz<strong>en</strong> HPA. Scripts andmedical knowledge : theory and applications for clinicalreasoning instruction and research. Acad Med2000;75:182-90.10. Brailowsky C, Charlin B, Beausoleil S, Cote S, VanDer Vleut<strong>en</strong> C. Measurem<strong>en</strong>t of clinical reflectivecapacity early in training as a predictor of clinicalreasoning performance at the <strong>en</strong>d of resid<strong>en</strong>cy : anexperim<strong>en</strong>tal study on the script concordance test.Med E<strong>du</strong>c 2001;35:430-6.11. Brazeau-Lamontagne L, Charlin B, Gagnon R,Samson L, Van Der Vleut<strong>en</strong> C. Measurem<strong>en</strong>t of perceptionand interpretation skills along radiology training: utility of the script concordance approach.Med Teach 2004;26:326-32.12. Sibert L, Charlin B, Corcos J, Gagnon R, Grise P,Van Der Vleut<strong>en</strong> C. Stability of clinical reasoningassessm<strong>en</strong>t results with the script concordance testaccross two differ<strong>en</strong>t linguistic, cultural and learning<strong>en</strong>vironm<strong>en</strong>ts. Med Teach 2002;24:522-7.13. Van Der Vleut<strong>en</strong> C. PM The assessm<strong>en</strong>t of professionalcompet<strong>en</strong>ce : developm<strong>en</strong>t, research, and practicalimplications. Adv Health Sci E<strong>du</strong>c Theory Pract1996;1:41-67.14. Newble DI, Hoare J, Baxter A. Pati<strong>en</strong>t managem<strong>en</strong>tproblems: issues of validity. Med E<strong>du</strong>c 1982;16:137-42.15. Norcini JJ, Shea JA, Day SC. The use of aggregatescoring for a recertifying examination. Evaluationand the Health Professions 1990;13:241-51.16. Crocker L, Algina J. Intro<strong>du</strong>ction to classical andmodern test theory. New York: Holt Reinhard andWinston, 1986:3-39.17. Cronbach LJ. Coeffici<strong>en</strong>t alpha and the internalstructure of tests. Psychometrika 1951;16:297-334.18. Swanson DB, Case SM. Tr<strong>en</strong>ds in writt<strong>en</strong> assessm<strong>en</strong>t :a strangely biased perspective. In : Hard<strong>en</strong> RM, HartIR (Eds.) Approaches of the assessm<strong>en</strong>t of clinical compet<strong>en</strong>ce.Norwich: Page Brothers, 1992:38-53.19. Swanson DB, Case SM. Variation of item difficultiesand discrimination by item format on part I (basicsci<strong>en</strong>ces) and part II (clinical sci<strong>en</strong>ces) of UsLic<strong>en</strong>sing Examination. In Rothman Ai, Coh<strong>en</strong> REds. Proceedings of the 6th Ottawa Confer<strong>en</strong>ce onMedical E<strong>du</strong>cation, Toronto, University of TorontoBookstore Custom Publishing, 1995:285-7.20. La<strong>du</strong>ca A. Validation of professional lic<strong>en</strong>sure examination.profession theory, test design, and constructvalidity. Evaluation and The Health Professions1994;17:178-97.21. Cabana MD, Rand CS, Powe NR, Wu AW, WilsonMH, Abboud PAC, Rubin HR. Why don’t physicianfollow clinical practice guidelines ? JAMA1999;282:1458-65.22. Chagnon I, Bounameaux H, Aujesky D, et al.Comparison of two clinical prediction rules andimplicit assessm<strong>en</strong>t among pati<strong>en</strong>ts with suspectedpulmonary embolism. Am J Med 2002;113:269-75.23. Halm EA, Atlas SJ, Borowsky LH, et al.Understanding physicians adher<strong>en</strong>ce with a pneumoniapractice guideline. Arch Intern Med 2000;160:98-104.24. Jouquan J. L’évaluation des appr<strong>en</strong>tissages des étudiants<strong>en</strong> formation médicale initiale. PédagogieMédicale 2002;3:38-52.Manuscrit reçu le 13 juillet 2005 ; comm<strong>en</strong>taires éditoriaux formulés aux auteurs le 9 novembre 2005 ; accepté pourpublication le 3 janvier 2006.30 PÉDAGOGIE MÉDICALE - Février 2006 - Volume 7 - Numéro 1

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!