13.11.2014 Views

These_NathanFaivre

These_NathanFaivre

These_NathanFaivre

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Thèse de Doctorat de l’Université Pierre et Marie Curie<br />

Spécialité : Neurosciences Cognitives<br />

Inconscient Cognitif et Encombrement Visuel<br />

Dissociations Entre Conscience Perceptuelle et Traitement en Vision Périphérique<br />

Présentée par Nathan Faivre<br />

Pour l’obtention du titre de Docteur de l’Université Pierre et Marie Curie<br />

Soutenue le 3 Novembre 2011<br />

Sous la direction de Dr. Sid Kouider<br />

LSCP UMR 8554 CNRS - EHESS - ENS<br />

Ecole Doctorale Cerveau Cognition Comportement<br />

Membres du jury<br />

Patrick Cavanagh (examinateur)<br />

Laurent Cohen (examinateur)<br />

Stanislas Dehaene (examinateur)<br />

Bruno Rossion (rapporteur)<br />

Rufin VanRullen (rapporteur)


Résumé<br />

Au cours des vingt dernières années, il a été clairement établi qu’une information visuelle<br />

pouvait être traitée en l’absence d’une expérience consciente associée. Cette dissociation<br />

a permis la description de l’inconscient cognitif, et par contraste, la caractérisation des<br />

fondements neurocognitifs de la conscience. Dans ce travail de thèse, nous avons déterminé<br />

la nature des traitements non conscients de stimuli périphériques encombrés, rendus<br />

indiscriminables par la présence rapprochée de voisins similaires. Pour cela, nous avons<br />

développé un paradigme d’encombrement contingent à la position du regard, auquel<br />

nous avons couplé des mesures comportementales d’adaptation sensorielle (amorçage,<br />

habituation) et des mesures d’activité cérébrale en imagerie par résonance magnétique<br />

fonctionnelle.<br />

La hiérarchie des traitements non conscients que nous avons pu ainsi esquisser s’étend<br />

de l’orientation angulaire jusqu’à la configuration de visages émotionnels, en passant<br />

par la directionnalité de symboles ou l’identité faciale. Des mesures comportementales<br />

et neurales à niveaux hiérarchiques différents nous ont également permis de mettre en<br />

évidence le rôle de l’amplification attentionnelle pour ces traitements.<br />

Par ailleurs, en tirant parti du fait qu’une information encombrée demeure indiscriminable<br />

indépendamment de la durée de stimulation, nous avons pu sonder des propriétés<br />

temporelles du traitement non conscient jusqu’alors méconnues. D’une part, nous avons<br />

montré que l’augmentation de la durée de présentation d’un stimulus encombré changeait<br />

qualitativement les réponses adaptatives qu’il générait, en transformant l’amorçage en<br />

habituation sensorielle. D’autre part, en comparant les bases neurales du traitement non<br />

conscient de visages émotionnels encombrés statiques (images) et dynamiques (vidéos),<br />

nous avons établi qu’ils étaient préférentiellement encodés au sein des voies visuelles<br />

ventrales et dorsales, respectivement.<br />

Nous discuterons des enseignements apportés par nos travaux selon deux grands axes.<br />

D’abord, nous analyserons en quoi l’étude de l’inconscient cognitif permet de mieux<br />

comprendre l’encombrement, et argumenterons que ses origines sont tardives et multiples,<br />

gouvernées en partie par des facteurs attentionnels descendants. Nous évaluerons ensuite<br />

l’apport de l’encombrement pour une étude contrastive de la conscience, et insisterons<br />

sur ses propriétés intégratives, aussi bien dans l’espace que dans le temps.<br />

Mots clefs<br />

Encombrement, conscience, perception, attention, adaptation sensorielle, émotion


Remerciements<br />

Ce que je retiendrai du travail de ces trois années, ce sont les concepts qui expliquent enfin mon<br />

incapacité remarquée à repérer mes clefs sur une table, ou pire, mes proches dans une foule.<br />

Plutôt qu’ahuri chronique, je me considère désormais comme simple victime de l’encombrement,<br />

limité en apparence par le fonctionnement conscient de mon cerveau. Cela m’est extrêmement<br />

confortable, et, j’espère, apaisant pour les proches susceptibles !<br />

Je dois l’idée première de ce travail à Sid Kouider, qui, trois ans plus tôt, a eu l’audace de me<br />

donner l’opportunité de démarrer ce projet de thèse sans garantie d’aucune sorte, puisque mon<br />

expérience dans le domaine des neurosciences cognitives frôlait alors le néant. Je lui exprime ma<br />

plus grande gratitude pour la confiance qu’il m’a témoignée. L’enthousiasme et l’énergie qu’il a<br />

insufflés dans mon travail ont été des plus bénéfiques, et j’espère pouvoir montrer ici que, comme<br />

souvent, son intuition ne l’a pas trompé.<br />

Je remercie Bruno Rossion et Ruffin VanRullen, rapporteurs au sein du jury, pour avoir accepté<br />

d’expertiser mon travail, ainsi que Patrick Cavanagh, Laurent Cohen, et Stanislas Dehaene, pour<br />

leurs rôles d’examinateurs au sein du jury. Je suis particulièrement reconnaissant envers Patrick<br />

Cavanagh, qui m’a prodigué des conseils précieux pour ce travail et mes projets futurs.<br />

L’École de l’Inserm a joué un rôle fondamental pour ma formation scientifique aux abords de la<br />

médecine. Merci à toute cette belle famille, et en particulier à Jean-Claude Chottard, Philippe<br />

Ascher, et François Amblard, qui donnent énormément pour guider chacun dans son exploration<br />

de la science.<br />

J’ai eu la chance de pouvoir côtoyer au LSCP des chercheurs humbles et brillants, dont Anne<br />

Christophe et Emmanuel Dupoux, et de manière quotidienne Jérôme Sackur, colocataire de laboratoire<br />

aussi drôle que savant. Je les remercie chaleureusement, ainsi que Michel et Vireack,<br />

prosélytes du libre, et Anne-Caroline, Inga, Isabelle, Radhia, et Virginie, équipe de choc responsable<br />

du recrutement des centaines de participants venus passer mes expériences.<br />

Évidemment, je remercie tous les compagnons de route, dont Marine (relectrice de l’introduction,<br />

donc entièrement responsable du moindre manque de clarté), Vincent & Vincent, Luca, Perrine,<br />

Baudouin, Belonia, Alejandrina, Abdellah, pour la première partie du parcours. Puis Sylvain<br />

(deuxième relecteur, donc tout autant responsable), Paul, Leonardo, Anne, Thomas, et Louise,<br />

arrivés pour la seconde partie. Enfin, des étudiants efficaces et sympathiques m’ont aidé, et<br />

évidemment, en sauront bientôt plus que moi : Arnaud, Bria, Claire, Jan, Lucille, et Marwa.<br />

Sans pouvoir tous les nommer, les amis qui m’éloignent de la science ne doivent jamais oublier<br />

qu’ils sont des plus précieux. J’espère arpenter avec vous tous encore de longues routes, sachez<br />

que vous êtes bienvenus en Californie !<br />

L’œil acéré de mon père a pallié la plus grande partie de mes lacunes grammaticales. La bienveillance<br />

de mes parents et de ma famille est telle qu’elle appelle bien plus que des remerciements.<br />

Je leur témoigne ici ma plus tendre affection.


Table des matières<br />

I Introduction 10<br />

1 Conscience et inconscient cognitif 11<br />

1.1 Tableau d’une étude scientifique de la conscience . . . . . . . . . . . . . . 12<br />

1.2 Aperçu sélectif du système visuel . . . . . . . . . . . . . . . . . . . . . . . 16<br />

1.3 Théories neurocognitives de la conscience . . . . . . . . . . . . . . . . . . 20<br />

1.4 Inconscient cognitif et approche contrastive . . . . . . . . . . . . . . . . . 33<br />

2 L’encombrement comme sonde de l’inconscient cognitif 39<br />

2.1 Faits empiriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

2.2 Théories de l’origine de l’encombrement . . . . . . . . . . . . . . . . . . . 42<br />

2.3 L’encombrement en tant que paradigme expérimental . . . . . . . . . . . . 50<br />

2.4 Plan des études expérimentales . . . . . . . . . . . . . . . . . . . . . . . . 54<br />

II Études expérimentales 56<br />

1 Amorçage non conscient issu d’objets encombrés 57<br />

1.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

1.2 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />

2 Biais de préférence non conscient issu d’expressions faciales 70<br />

2.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

2.2 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />

3 Stimulation visuelle et profondeur du traitement non conscient 79<br />

3.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

3.2 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

4 Bases neurales du traitement non conscient d’expressions faciales 113<br />

4.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113


4.2 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116<br />

5 Influences de la durée de stimulation et de l’accès conscient sur l’adaptation<br />

sensorielle 147<br />

5.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147<br />

5.2 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />

III Discussion 177<br />

1 Étudier l’encombrement via l’inconscient cognitif 178<br />

1.1 Vers un modèle hiérarchique de l’encombrement . . . . . . . . . . . . . . . 178<br />

1.2 Rôle de l’attention . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185<br />

2 Étudier la conscience via l’encombrement 188<br />

2.1 Encombrement et conscience partielle . . . . . . . . . . . . . . . . . . . . . 188<br />

2.2 Encombrement et intégration spatiale . . . . . . . . . . . . . . . . . . . . 191<br />

2.3 Inconscient cognitif et temporalité . . . . . . . . . . . . . . . . . . . . . . 193<br />

IV Conclusion 199<br />

V Annexe 203<br />

1 Bases neurales de l’amplification attentionnelle non consciente 204<br />

1.1 Présentation de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204<br />

1.2 Résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207<br />

1.3 Discussion et perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 210<br />

Bibliographie 213<br />

7


Table des figures<br />

Figure 1.1 Interprétation de l’effet Sperling selon l’hypothèse dissociative et de<br />

conscience partielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

Figure 1.2 Comparaison des modalités perceptives selon les théories de l’espace<br />

de travail neuronal global et de la ré-entrance. . . . . . . . . . . . . 29<br />

Figure 2.1 Exemples de stimuli encombrés. . . . . . . . . . . . . . . . . . . . . 42<br />

Figure 2.2 Métamères en vision périphérique. . . . . . . . . . . . . . . . . . . . 46<br />

Figure 2.3 Adaptation à l’orientation en fonction de l’encombrement. . . . . . . 49<br />

Figure 2.4 Encombrement contingent à la position du regard (GCC). . . . . . . 51<br />

Figure 1.1 Encombrement configural de visages de type Mooney. . . . . . . . . 183<br />

Figure 1.2 Représentation rétinotopique de stimuli controlatéraux ou ipsilatéraux<br />

au méridien vertical et horizontal. . . . . . . . . . . . . . . . . 184<br />

Figure 1.3 Amplification attentionnelle en fonction de la taille du stimulus et<br />

de la fenêtre attentionnelle. . . . . . . . . . . . . . . . . . . . . . . . 187<br />

Figure 2.1 Manipulation des dimensions accédées pendant l’encombrement. . . 189<br />

Figure 2.2 Amorçage et habituation en fonction de la rétinotopie. . . . . . . . . 196<br />

Figure 1.1 Paradigme expérimental utilisé en IRMf. . . . . . . . . . . . . . . . 205<br />

Figure 1.2 Localisation fonctionnelle de la FFA et de la PPA. . . . . . . . . . . 207<br />

Figure 1.3 Effet attentionnel en cerveau entier. . . . . . . . . . . . . . . . . . . 209


Liste des symboles<br />

CFS Suppression par flashs continue<br />

CGL Corps géniculé latéral<br />

EEG Electroencéphalographie<br />

FFA Aire fusiforme des visages (fusiform face area)<br />

GCC Encombrement contingent à la position du regard (gaze-contingent crowding)<br />

GNW Espace de travail neuronal global (global neuronal workspace)<br />

IIT Théorie de l’intégration de l’information<br />

IRMf Imagerie par résonance magnétique fonctionnelle<br />

LOC Cortex occipital latéral<br />

NCC Corrélats neuraux de la conscience<br />

PPA Aire parahippocampique des lieux (parahippocampic place area)<br />

PPI Interaction psychophysiologique<br />

SOA Asynchronie d’apparition du stimulus (stimulus onset asynchrony)<br />

STS Sulcus temporal supérieur<br />

TMS Stimulation magnétique transcranienne<br />

V1 Cortex visuel primaire<br />

VWFA Aire visuelle de la forme des mots (visual word form area)


Première partie<br />

Introduction


1 Conscience et inconscient cognitif<br />

Lorsqu’il y a trois ans nous débutions notre interrogation sur l’étude scientifique de la<br />

conscience, la question qui nous est apparue comme la plus vertigineuse est la suivante :<br />

comment la sensation, l’expérience subjective qui emplit notre existence naît-elle du<br />

tissu biologique pesant un peu plus d’un kilogramme qui n’emplit lui que notre boîte<br />

crânienne ? Autrement dit, nous débutions ce travail de thèse de la meilleure des manières,<br />

en prenant de plein fouet l’énoncé du problème dit - à juste titre - difficile. Il convient,<br />

comme pour toute situation vertigineuse, de ne pas regarder immédiatement au fond du<br />

gouffre, mais plutôt de procéder par étape. C’est la résolution que nous nous sommes<br />

imposée par la suite, et cela nous mènera au traitement du problème dit - à moins<br />

juste titre - facile. Ces problèmes millénaires n’ont que très récemment été abordés par la<br />

méthode expérimentale. De multiples résultats expérimentaux en sont issus, expliqués par<br />

quelques grandes théories dont nous tenterons d’esquisser ensuite les principes généraux.<br />

Un des dénominateurs communs de ces théories est d’appréhender la conscience en la<br />

contrastant à son absence. C’est l’étude de l’inconscient cognitif, l’estimation de sa profondeur,<br />

la mesure de ses propriétés psychologiques et neurales. C’est la démarche qui<br />

guide l’intérêt porté à l’encombrement visuel (crowding) dans le chapitre 2, une modalité<br />

de l’expérience consciente visuelle où les détails d’une scène apparaissent brouillés, et<br />

échappent au rapport conscient. Les travaux expérimentaux contenus dans ce manuscrit,<br />

appartiennent à la fois au domaine de la psychologie expérimentale, de la psychophysique<br />

et des neurosciences cognitives, et portent sur le traitement perceptuel et cognitif non<br />

conscient de stimuli encombrés. Une caractéristique générale de ces travaux réside dans<br />

l’approche dialectique qu’ils proposent, en ce sens qu’ils peuvent être appréhendés comme<br />

travaux portant sur l’inconscient cognitif, par utilisation du phénomène d’encombrement<br />

vu comme méthode, ou comme travaux sur le phénomène d’encombrement, par utilisation<br />

du cadre théorique et expérimental de l’inconscient cognitif. C’est la manière avec<br />

laquelle sera abordée la discussion concernant l’apport de ces travaux aux sciences de la<br />

vision et aux sciences de la conscience.<br />

11


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.1 Tableau d’une étude scientifique de la conscience<br />

1.1.1 Plusieurs problèmes posés<br />

Problème difficile<br />

Le problème difficile de la conscience, celui d’expliquer la réalité du ressenti, de la sensation,<br />

de l’expérience subjective, a réduit à la circonspection plus d’un philosophe contemporain.<br />

Ainsi, David Chalmers à qui l’on doit ce terme (1995) le qualifie de « problème le<br />

plus déroutant des sciences de l’esprit », John Searle (1997) en fait le « problème le plus<br />

important des sciences biologiques ». Sans qu’il soit donné trop de poids à de telles citations<br />

hors de leurs contextes, nous pouvons simplement les considérer comme illustrant<br />

un rapport troublé de l’homme à la conscience. En effet, il a été proposé que les modèles<br />

biologiques, aussi aptes soient-ils à expliquer les mécanismes associés à la perception, la<br />

mémoire, ou toute autre fonction cognitive, resteraient inaptes à expliquer la sensation<br />

consciente (Chalmers, 1995). Nous évoquerons pour cela deux raisons générales.<br />

La première raison est que la résolution du problème difficile implique directement celle<br />

du problème corps-esprit. La relation entre la matière et l’activité mentale a fait de<br />

tout temps l’objet d’études, d’abord philosophiques et plus récemment psychologiques et<br />

neurobiologiques, desquelles sont nées plusieurs solutions inscrites dans plusieurs écoles<br />

de pensée. Nous n’évoquerons dans ce travail de thèse que les tentatives de solutions<br />

matérialistes, investigables par la méthode expérimentale. Nous présupposerons ainsi un<br />

lien direct et univoque entre matière et expérience subjective, le paradigme actuel étant<br />

que cette dernière est associée au fonctionnement particulier d’une assemblée de neurones<br />

fonctionnant en réseaux. La position adoptée ici est donc physicaliste au sens où la<br />

conscience est considérée comme identique à ses corrélats neuraux (voir Gray, 2004 pour<br />

une vue détaillée d’autres écoles de pensée, notamment dualistes). Si les théories matérialistes<br />

ne font appel à aucune autre entité pour expliquer la relation de la conscience<br />

avec la matière, les mécanismes qu’elles proposent se heurtent à un pouvoir explicatif qui<br />

peut sembler à première vue limité. Ainsi, nous verrons dans la partie 1.3 page 20 que<br />

la conscience est vue tour à tour comme la ré-entrance (Lamme & Roelfsema, 2000), la<br />

diffusion globale (Dehaene & Naccache, 2001), ou l’intégration (Tononi, 2008) de l’information<br />

traitée par le cerveau.<br />

La définition ainsi donnée par ces théories à une phénoménologie très concrète nous<br />

amène à la deuxième raison expliquant la difficulté du problème : son caractère privé.<br />

12


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

L’expérience subjective est en effet non partageable à autrui sans perte d’information.<br />

Elle est de plus subjective puisque dépendante de chaque individu et du contexte dans<br />

lequel il se trouve (Nagel, 1974). Par ailleurs, le simple fait de de s’interroger sur ce que<br />

cela est d’être conscient génère un effet d’observateur, puisque cela nous plonge dans un<br />

état métacognitif différent de celui que l’on cherche à définir en premier lieu. Certains<br />

ont proposé d’éviter ces écueils par l’utilisation de définitions minimales mais opérationnelles,<br />

en entendant par conscience les expériences subjectives (sentience, awareness) qui<br />

« commencent quand je me réveille le matin après un sommeil sans rêve, et qui continuent<br />

pendant la journée jusqu’au moment ou je m’endors de nouveau » (Searle, 1997).<br />

On peut opposer à cette définition le fait qu’elle néglige l’ensemble des modulations existant<br />

à l’intérieur de cette période de conscience, qui s’avèrent cruciales pour appréhender<br />

le phénomène dans son ensemble. Dans l’idée d’appréhender de manière efficace le problème,<br />

d’autres ont tenté de le réduire à deux dimensions, l’une étant le contenu de la<br />

conscience, l’expérience subjective à proprement parler (awareness), l’autre étant le niveau<br />

de conscience ou d’éveil (wakefulness). En règle général, la relation entre contenu<br />

et niveau de conscience est positive et linéaire. Les états vont de la mort cérébrale jusqu’à<br />

l’éveil complet, en passant par les différentes phases du sommeil. Des dissociations<br />

comme le somnambulisme, l’état végétatif (niveau élevé, contenu pauvre), ou le sommeil<br />

paradoxal (contenu riche, niveau faible) troublent cette relation linéaire, et sont<br />

particulièrement instructives dans le cadre d’une approche contrastive de la conscience<br />

(voir section 1.4.1 page 33). Les travaux expérimentaux contenus dans ce manuscrit ne<br />

concernent que le contenu de la conscience.<br />

Problème facile<br />

Les neurosciences cognitives se sont récemment emparées du problème facile, c’est à dire<br />

l’étude des mécanismes cognitifs associés à l’accès des contenus conscients, en première<br />

approximation leur rapportabilité. Ainsi, l’interaction des mécanismes associés à la perception,<br />

l’attention, la mémoire de travail, le langage considérés comme donnant lieu à<br />

l’accès conscient sont de mieux en mieux compris. En revanche, l’explication d’une phénoménologie<br />

associée à des mécanismes neuraux ne rentre pas dans le cadre de l’étude du<br />

problème facile. Selon la dichotomie proposée par Ned Block (1995), le problème facile<br />

consiste donc à éclaircir les mécanismes associés à la conscience d’accès (dite conscience<br />

A), en laissant ouvert le problème difficile traitant de la conscience phénoménale (dite<br />

conscience P). Les mécanismes associés au rapport de l’information présentant des limites,<br />

le contenu de la conscience P est dit plus riche que le contenu de la conscience A.<br />

13


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

On confondrait alors les limites des fonctions cognitives nécessaires à l’accès (attention,<br />

mémoire) avec les limites réelles de la sensation visuelle (Lamme, 2010). Ainsi, l’impression<br />

subjective de richesse et de fidélité que l’on a en percevant une scène visuelle est<br />

partiellement déconnectée des habiletés cognitives, et des changements mêmes majeurs<br />

intervenant dans la scène peuvent ne pas être accédés, et donc détectés (phénomène de<br />

cécité au changement, voir Simons & Rensink, 2005).<br />

Les défenseurs de cette dichotomie se sont emparés d’une expérience classique, antérieure<br />

même au concept de conscience tel qu’il est utilisé aujourd’hui pour illustrer la conscience<br />

P outrepassant la conscience A. Dès 1960, Sperling mesure que des participants faisant<br />

face à une matrice de 4 × 3 lettres présentées brièvement sont capables de rapporter<br />

correctement trois ou quatre lettres en moyenne, alors que leur impression est de percevoir<br />

correctement les douze. Cette impression est décrite comme un état mental P non<br />

accédé. Pourtant, si un indice sonore indique aux participants la ligne de la matrice à<br />

rapporter après que l’ensemble des lettres a disparu, ils rapportent correctement les trois<br />

lettres de la ligne correspondante. C’est ce qui est dorénavant appelé l’effet Sperling. Il a<br />

été conclu dans un premier temps que chaque lettre de la matrice est encodée consciemment<br />

avant l’apparition de l’indice sonore, dans un tampon de la mémoire visuelle qualifié<br />

d’iconique qui se vide après un court instant si l’attention ne permet pas son amplification.<br />

L’existence de deux formes d’encodage de l’information, l’une de grande capacité<br />

s’évanouissant rapidement dans le temps, l’autre plus réduite mais liée aux processus<br />

cognitifs permettant la rapportabilité est indubitable. Par la suite, il a été postulé que<br />

la mémoire iconique reflétait le contenu de la conscience P, sans accès conscient, et donc<br />

sans rapport verbal.<br />

Une deuxième interprétation dite de conscience partielle ne présuppose pas de distinction<br />

entre conscience phénoménale et conscience d’accès (Kouider et al., 2010). Selon cette hypothèse,<br />

les participants faisant face à la matrice avant l’indice sonore accèdent consciemment<br />

à l’information visuelle principalement de bas niveau (gradients de contrastes, lignes<br />

orientées, voire fragments de lettres). Cette information fragmentaire est biaisée par le<br />

contexte expérimental (la présence des 3 ou 4 lettres traitées consciemment en totalité, et<br />

potentiellement les autres lettres traitées inconsciemment), ce qui induit les participants<br />

à reconstruire l’information de manière illusoire, et leur donne l’impression subjective<br />

d’avoir une perception complète de l’ensemble de la matrice. Le caractère illusoire de<br />

leur perception a été vérifié, en mesurant qu’ils demeuraient incapables de percevoir des<br />

fausses lettres, voire des symboles abstraits glissés aléatoirement dans la matrice (de Gardelle<br />

et al., 2009). Ici, à l’opposé de la première interprétation dissociant phénoménologie<br />

14


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

et accès, l’impression de richesse phénoménale découle donc d’une reconstruction cognitive<br />

à posteriori, et non pas d’un état préalable à l’accès conscient (voir Figure 1.1).<br />

Tel qu’il est défini, le problème facile englobe alors le problème difficile, en ce sens que<br />

l’expérience subjective est vue comme l’interaction des mécanismes cognitifs nécessaires<br />

à la manipulation métacognitive et au rapport à soi-même ou à autrui de l’information.<br />

Figure 1.1: Interprétation de l’effet Sperling selon l’hypothèse dissociative et de conscience partielle.<br />

Lorsque douze lettres sont présentées brièvement à des participants, ils n’en rapportent<br />

que trois ou quatre. En revanche, s’il leur est indiqué quelle sous partie de la matrice rapporter,<br />

ils rapportent quasiment son ensemble, ce qui suggère qu’ils ont perçu en réalité l’entièreté de<br />

la matrice. Selon une vue dissociative de la conscience (Interprétation 1), les participants n’ont<br />

accès qu’à trois ou quatre lettres, les autres disparaissant du tampon de la mémoire iconique par<br />

manque d’amplification attentionnelle (ellipses vertes), mais ont une expérience phénoménale de<br />

l’identité de toutes. Selon l’hypothèse de conscience partielle (Interprétation 2), les participants<br />

accèdent consciemment au contenu de bas niveau des lettres (contraste, orientation, fragments de<br />

lettres), tout en étant biaisé par le contenu de haut niveau accédé (lettres complètes). Cela pousse<br />

à reconstruire le contenu fragmentaire accédé en fonction du contexte, ce qui suppose que l’impression<br />

de richesse perceptive ne précède pas l’accès conscient mais découle d’une construction<br />

cognitive. (Adapté de Kouider et al., 2010).<br />

En rapport direct avec notre travail, il a été proposé que l’encombrement offrait une<br />

modalité dans laquelle les ressources attentionnelles pour accéder à l’information n’étaient<br />

pas suffisantes, tout en autorisant néanmoins une expérience phénoménale non réflexive<br />

de cette information (voir Block, 2001, ainsi que le chapitre 2 page 39). Dans toute la<br />

suite de nos travaux, et en lien à la fois avec le modèle de conscience partielle et de<br />

l’espace de travail neuronal global, nous opterons pour une position non dissociative, et<br />

considérerons donc qu’il y a un lien d’identité entre phénoménalité et réflexivité, c’est à<br />

dire entre expérience subjective et conscience d’accès.<br />

15


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.2 Aperçu sélectif du système visuel<br />

Ces dernières années, les sciences de la conscience se sont bâties en majorité sur l’étude<br />

de la vision, dont la chaîne de traitement s’étend depuis la rétine jusqu’au cortex cérébral.<br />

Nous mêmes dans ce travail avons étudié l’encombrement, phénomène intriguant<br />

rendant compte du fait que des objets en périphérie du champ de vision ne sont plus<br />

reconnaissables lorsqu’ils sont mis en présence de voisins proches et ressemblants (Levi,<br />

2008). La compréhension des théories neurocognitives de la conscience et du phénomène<br />

d’encombrement nécessite donc que l’on reprenne au moins partiellement le processus qui<br />

mène à la représentation de l’environnement au sein du système visuel. Nous détaillerons<br />

uniquement les étapes tardives de ce processus, plus pertinentes en vue de notre objectif.<br />

Le sens visuel trouve sa source au niveau de la transduction d’énergie lumineuse issue<br />

d’objets environnants en signal électrique interprétable par le cerveau. Cette transduction<br />

photo-électrique a lieu au niveau de la rétine, grâce à des cellules dites photo-réceptrices<br />

que sont les cônes, alloués à la vision diurne, ou photopique, situés majoritairement au<br />

centre de la rétine (en position fovéale) et les bâtonnets, pour la vision nocturne, ou scotopique,<br />

plus nombreux et situés majoritairement en périphérie. Chaque cellule contient<br />

un pigment, la rhodopsine, qui lorsque sa conformation est modifiée par l’absorption d’un<br />

photon, induit par une cascade enzymatique la fermeture de canaux entrants sodiques,<br />

entraînant ainsi l’hyperpolarisation cellulaire et l’inhibition du relargage pré-synaptique<br />

glutamatergique (voir Baylor, 1996, pour une revue de la littérature).<br />

On définit le champ récepteur du photorécepteur comme la région de l’espace qui, lorsqu’elle<br />

est soumise à la stimulation lumineuse, entraîne l’hyperpolarisation cellulaire.<br />

Paradoxalement, la stimulation du champ des photorécepteurs a donc pour conséquence<br />

la réduction de leurs taux de décharge 1 . Les photorécepteurs activent des cellules dites<br />

bipolaires, leurs champ récepteur étant défini comme la région anatomique dont l’activation<br />

synaptique par les photorécepteurs modifie le potentiel cellulaire. Du fait de la<br />

dualité des récepteurs bipolaires post-synaptiques, il existe des cellules bipolaires possédant<br />

des champs récepteurs aux propriétés d’excitation différentes. Ils rendent compte<br />

d’un étage précoce du traitement d’une première caractéristique du monde environnant,<br />

le contraste.<br />

On distingue dès lors deux voies qui mesurent indépendamment l’augmentation et la<br />

diminution de la quantité de lumière. Ces deux voies, respectivement ON et OFF, fonc-<br />

1. On peut considérer qu’ils réalisent ainsi une transduction photo-électrique anti corrélée, mais néanmoins<br />

efficace puisque sensible à des énergies transportées par le photon unique.<br />

16


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

tionnent en parallèle et demeurent indépendantes dans leur connexion avec l’étage supérieur<br />

que constituent les cellules ganglionnaires, jusqu’au niveau cortical. Plusieurs<br />

mécanismes d’inhibition et d’amplification du signal interviennent de manière supplémentaire,<br />

nous ne les détaillerons pas ici (voir Ryan et al., 2005 pour une revue exhaustive<br />

des connaissances sur la physiologie rétinienne). Il est en revanche intéressant pour<br />

la suite de préciser l’existence de deux types distincts de cellules ganglionnaires. Environ<br />

90% des cellules sont de type P (Parvus, pourvues d’un corps cellulaire et de champs<br />

récepteurs de tailles réduites, associées aux cônes), le reste de la population étant constituée<br />

des cellules M (Magnus, car pourvues d’un corps cellulaire et de champs récepteurs<br />

de tailles importantes, associées aux bâtonnets) 2 . Les axones des cellules ganglionnaires<br />

se rejoignent pour former le nerf optique, qui quitte chaque œil au niveau de la papille<br />

optique, ou tâche aveugle. C’est cet étage ganglionnaire qui constitue le moyen de sortie<br />

vers le cerveau, l’information étant véhiculée sous forme de trains de potentiels d’action,<br />

respectivement au niveau de la voie parvocellulaire et magnocellulaire.<br />

Après décussation partielle des fibres nerveuses du nerf optique, un premier relais a lieu<br />

au niveau du corps géniculé latéral (CGL, dans la partie dorsale du thalamus). Le CGL<br />

est une structure stratifiée, les quatre strates les plus dorsales recevant les axones de la<br />

voie parvocellulaire, les deux strates ventrales les axones de la voie magnocellulaire, avec<br />

une organisation agencée en fonction de l’origine anatomique de la fibre (partie médiale<br />

ou latérale de la rétine droite ou gauche). Le CGL est souvent considéré comme une<br />

plaque tournante entre les afférences sensorielles et le cortex. Pourtant, il ne se résume<br />

pas à des portes d’entrée et de sortie. En effet, il a été montré que la représentation de<br />

l’environnement à ce niveau sous-cortical respecte la rétinotopie, c’est à dire une topographie<br />

caractérisée par une relation univoque avec la position des objets physiques dans<br />

l’environnement. De plus, on sait les neurones du CGL sensibles à des propriétés physiques<br />

simples de l’environnement telles que le contraste ou la fréquence de clignotement.<br />

Ces éléments témoignent d’un traitement de l’information au moins partiel avant les aires<br />

corticales. Des études d’imagerie ont également pu mettre en évidence des modulations<br />

attentionnelles de l’activité géniculaire, en montrant notamment des réponses neurales<br />

plus importantes pour des stimuli visuels attendus (amplification attentionnelle) ainsi<br />

que des réponses neurales plus faibles pour des stimuli ignorés (inhibition attentionnelle)<br />

(voir Kastner et al., 2006, pour une revue de la littérature).<br />

Depuis chaque CGL partent des axones formant des faisceaux de substances blanches<br />

appelées radiations optiques, s’étirant sur environ 10cm pour rejoindre le cortex visuel<br />

2. A noter également l’existence de cellules non M - non P, aussi dites K pour koniocellulaires (Hendry<br />

& Reid, 2000)<br />

17


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

ipsilatéral appelé cortex primaire, strié, ou encore V1, au niveau du lobe occipital. A ce<br />

niveau, la propriété des champs récepteurs (régie par l’agencement de plusieurs champs<br />

récepteurs du CGL) fait émerger une nouvelle propriété, la détection de l’orientation. Les<br />

travaux fondateurs de Hubel & Wiesel (1959) ont montré que chaque neurone présente<br />

une orientation préférentielle pour laquelle la fréquence de potentiels d’action est maximale.<br />

Plus précisément, deux types cellulaires sont classiquement décrits : les cellules<br />

dites simples, dont le champ récepteur est caractérisé par une zone centrale excitatrice<br />

allongée sensible à l’orientation, et les cellules dites complexes, recevant des afférences des<br />

cellules simples, et possédant des champs récepteurs sensibles à l’orientation des bords<br />

du stimulus et à leur direction. Sans s’attarder sur les détails histologiques et anatomiques<br />

de V1, c’est cette dernière propriété qui retiendra notre attention pour la suite<br />

de l’exposé. Il est également important de préciser que des modulations attentionnelles<br />

de l’activité de V1 sont maintenant bien documentées (Somers et al., 1999).<br />

D’une topographie euclidienne au niveau de la rétine, on passe à un système de coordonnées<br />

polaires dans le cortex, où le champ visuel est cartographié selon une excentricité et<br />

un angle. La quantité de tissu cortical alloué à la représentation d’une unité de distance<br />

au niveau de la rétine est inversement proportionnelle à l’excentricité. On parle de facteur<br />

d’agrandissement, très important au niveau de la fovéa, pour l’analyse fine de détails,<br />

alors que la périphérie de la rétine est encodée plus grossièrement sur la surface corticale,<br />

tels que des points éloignés sur la rétine sont encodés relativement proches sur la surface<br />

corticale. Nous reviendrons sur la rétinotopie lorsque nous évoquerons le phénomène<br />

d’encombrement, très prégnant en vision périphérique.<br />

Cette organisation rétinotopique reste en partie valable pour les zones corticales successives,<br />

qualifiées d’extrastriées. Les neurones de V1 envoient des efférences vers le cortex<br />

pré-strié, secondaire, ou encore V2, qui est pourvu de propriétés similaires comme l’encodage<br />

de propriétés simples (orientation, contraste), la modulation attentionnelle, mais<br />

aussi de propriétés plus évoluées comme le traitement des lignes imaginaires (c’est à<br />

dire inexistantes physiquement mais perçues par reconstruction de deux bords adjacents<br />

par exemple), la dissociation figure-fond, etc. Aux aires primaires et secondaires succèdent<br />

les aires tertiaires, ou associatives. Chacune des ces aires encode des propriétés de<br />

plus en plus complexes du monde physique comme la couleur, la texture, la profondeur,<br />

la cohérence du mouvement, et notamment des catégories spécifiques d’objets. Ainsi,<br />

l’avènement de l’imagerie cérébrale fonctionnelle a permis de cartographier des régions<br />

occipito-temporales répondant préférentiellement à la présentation de visages (aire occipitale<br />

des visages, ou OFA, Gauthier et al., 2000, et aire fusiforme des visages, ou FFA,<br />

18


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

Kanwisher et al., 1997), de lieux (aire parahippocampique des lieux, ou PPA, Epstein &<br />

Kanwisher, 1998), de mots (aire de la forme visuelle des mots, ou VWFA, Cohen et al.,<br />

2000), ou encore de parties du corps (aire extrastriée du corps, ou EBA, Downing et al.,<br />

2001). Le principe d’organisation dans les aires visuelles supérieures est hérité des aires<br />

plus précoces, impliquant l’excentricité dans le champ de vision mais aussi la catégorie<br />

d’objets encodée (Malach et al., 2002). Les catégories nécessitant l’analyse fine de détails,<br />

tels les mots ou les visages sont représentées de manière latérale, avec un facteur d’agrandissement<br />

élevé, alors que les autres objets tels les bâtiments, nécessitant l’intégration de<br />

l’information sur de plus grandes distances rétiniennes sont encodés médialement, avec<br />

des facteurs d’agrandissements plus faibles (Hasson et al., 2002). Cette organisation est<br />

complexe, puisque par ailleurs, la perception d’objets périphériques est assistée par des<br />

connections reliant les aires périphériques occipito-temporales avec le cortex extrastrié<br />

fovéal (Williams et al., 2008).<br />

Un modèle permet d’appréhender avec concision une telle complexité. Il propose l’existence<br />

de deux voies, traitant des informations visuelles différentes, et responsables d’aptitudes<br />

comportementales complémentaires (Milner & Goodale, 1993, 2006, 2008). La<br />

première est la voie ventrale, responsable de la vision pour la perception, de par la transformation<br />

du signal en représentation perceptuelle renfermant les propriétés d’objets ainsi<br />

que leurs relations spatiales. Ces représentations sont considérées comme étant associées<br />

à une expérience subjective consciente de l’environnement, permettant ainsi son exploration.<br />

La deuxième est la voie dorsale, responsable de la vision pour l’action, de par le<br />

contrôle visuel de cibles sur lesquelles sont dirigées certaines actions motrices comme la<br />

préhension. Ce contrôle se fait en direct et adapte à tout moment les effecteurs moteurs<br />

en fonction de leur cible. On peut alors distinguer les représentations mentales associées<br />

à la perception consciente du monde et à la cognition visuelle (voie ventrale) et le<br />

contrôle perceptuo-moteur nécessaire au bon déroulement d’une action une fois celle-ci<br />

initiée (voie dorsale). Si la voie ventrale est nécessaire à l’établissement d’une action,<br />

par exemple pour la représentation perceptuelle des détails d’un objet en vue de l’attraper,<br />

elle n’est plus impliquée une fois initié le mouvement de la main. Dès lors, la voie<br />

dorsale, qui ne renferme pas de description physique sur l’objet, permettra le contrôle<br />

en temps réel de l’action, sans qu’aucune expérience consciente de ce contrôle ne soit<br />

ressenti, elle n’est donc en soit pas perceptuelle. Tandis que les afférences ventrales sont à<br />

la fois magnocellulaires et parvocellulaires, seules des fibres magnocellulaires constituent<br />

la voie dorsale (Ferrera et al., 1992; Merigan & Maunsell, 1993). Nous reviendrons sur<br />

la distinction entre voie ventrale et voie dorsale dans le chapitre 4 concernant les bases<br />

neurales du traitement d’expressions faciales.<br />

19


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.3 Théories neurocognitives de la conscience<br />

1.3.1 Ré-entrance et conscience<br />

Une propriété commune à plusieurs théories est que la conscience nécessite une activité<br />

neurale ré-entrante, c’est à dire la transmission d’un signal neural retournant des modules<br />

cognitifs de haut niveau vers les modules perceptuels. Les activités ré-entrantes au sein<br />

de boucles cortico-corticales ou thalamo-corticales ont été décrites comme formant un<br />

noyau dynamique (dynamic core), permettant le maintien de patterns synchrones dans<br />

le temps, à même de connecter et d’intégrer des modules cognitifs distincts supportés par<br />

différentes aires cérébrales (Tononi & Edelman, 1998). Ainsi, une région répondant à un<br />

stimulus peut, par activité ré-entrante, donner lieu à une réponse similaire en l’absence de<br />

ce stimulus. Le cerveau est alors vu comme se parlant à lui même, ce qui semble autoriser<br />

l’émergence de fonctions cognitives de haut niveau comme la mémoire ou l’imagerie<br />

mentale.<br />

Les évidences pour le rôle de la ré-entrance existent également à un niveau purement<br />

perceptuel. Lors de la présentation d’un stimulus visuel, les aires cérébrales spécialisées<br />

dans le traitement de ses propriétés physiques sont successivement activées au sein d’une<br />

cascade organisée selon un gradient anatomique postéro-antérieur. Cette vague d’activations<br />

s’apparente à un balayage vers l’avant (feedforward sweep), démarrant au sein de la<br />

couche 4 du cortex visuel primaire, jusqu’aux aires temporales antérieures pour la voie<br />

visuelle ventrale, et pariétale antérieure pour la voie visuelle dorsale. Les données électrophysiologiques<br />

indiquent une augmentation de la taille et de la spécificité des champs<br />

récepteurs des neurones suivant le gradient anatomique de cette cascade (Maunsell &<br />

Newsome, 1987). En revanche, les différentes structures impliquées dans ce balayage<br />

vers l’avant ne sont pas strictement activées selon son gradient anatomique, les voies<br />

visuelles possédant des vitesses et des trajets variables, notamment selon qu’elles soient<br />

à dominance magnocellulaire ou parvocellulaire ou qu’elles empruntent des raccourcis<br />

sous-corticaux (cf. Lamme & Roelfsema, 2000, pour une méta-analyse des données de<br />

latences de réponses visuelles). On peut donc parler de balayages vers l’avant multiples,<br />

ayant lieu en parallèle, où chaque synapse est franchie en environ 10ms (soit la durée<br />

minimale entre deux potentiels d’actions), impliquant que les régions temporales antérieures<br />

et frontales sont atteintes en environ 100ms. Les activités neurales engendrées lors<br />

de cette première vague d’activations présentent déjà une spécificité relative au stimulus<br />

qu’elles encodent, par exemple l’orientation dès V1, le mouvement dès V5, ou encore les<br />

visages au niveau du cortex temporal inférieur.<br />

20


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

Cette observation a d’abord laissé penser que l’ensemble du traitement cortical d’un stimulus<br />

était complet à l’issue de cette cascade (Tovée, 1994). Pourtant, deux éléments<br />

majeurs ont obligé à reconsidérer le problème. Premièrement, si la réponse neuronale<br />

précoce est sensible à la nature du stimulus, les réponses mesurées à des latences plus<br />

grandes sont par ailleurs corrélées à des caractéristiques plus fines du traitement perceptuel,<br />

comme l’identité ou les expressions faciales au niveau du cortex temporal inférieur<br />

(Sugase et al., 1999), où la prise de décision au sein du cortex pariétal latéral (Leon<br />

& Shadlen, 1998). Deuxièmement, il a été montré dans plusieurs circonstances que la<br />

réponse d’un neurone était modulée par des informations contextuelles situées en dehors<br />

de son champ récepteur, donc par définition par un moyen autre que celui fourni par<br />

les connexions du balayage vers l’avant (cf. Lamme & Roelfsema, 2000, pour une revue<br />

détaillée). Ces deux faits empiriques ont conduit à postuler l’existence de connexions réentrantes,<br />

soit horizontales au sein d’une même région corticale, soit antéro-postérieures<br />

provenant de régions en aval de la cascade. Il y aurait donc un échange bidirectionnel de<br />

signaux codant pour des aspects complémentaires d’un même stimulus.<br />

En plus de son rôle dans la cognition visuelle, plusieurs faits empiriques viennent appuyer<br />

le mécanisme de ré-entrance comme un corrélat de la conscience. Premièrement,<br />

au cours du masquage visuel, la perception consciente d’un stimulus présenté brièvement<br />

est empêchée par la présentation subséquente d’un masque. Si le masque ne perturbe pas<br />

l’activité balayée vers l’avant issue du stimulus, il empêche en revanche les boucles de réentrance<br />

qui lui sont associées (Lamme et al., 2002) 3 . Deuxièmement, l’application d’un<br />

fort champ magnétique par stimulation magnétique transcranienne (TMS, environ 2 Teslas<br />

pendant 1ms) au niveau du cortex visuel primaire 100ms après la présentation d’un<br />

stimulus empêche son rapport conscient, tout en préservant la capacité des participants<br />

à deviner au dessus du niveau du hasard l’orientation ou la couleur du stimulus présenté<br />

(Boyer et al., 2005). Cette situation expérimentale mime une situation pathologique dite<br />

de vision aveugle de type II (Weiskrantz, 2004). Le cadre théorique de la ré-entrance<br />

prédit que l’impulse de TMS à 100ms dégrade l’efficacité des connexions ré-entrantes et<br />

donc empêche l’accès conscient. Cependant, une étude plus récente a montré que la perception<br />

consciente du mouvement était également empêchée lors d’un impulse précoce de<br />

TMS supposé dégrader le balayage vers l’avant uniquement, tandis qu’un impulse tardif<br />

dégradant l’activité ré-entrante empêche certes l’accès conscient, mais également le traitement<br />

non conscient corrélant avec le balayage vers l’avant (Koivisto et al., 2010). Cette<br />

dernière observation est donc incompatible avec une interprétation forte de la théorie qui<br />

3. A noter également qu’il existe une interprétation ascendante du masquage, reposant sur des mécanismes<br />

d’inhibition latérale au sein du cortex sensoriel (Macknik, 2006).<br />

21


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

présuppose que l’activité ré-entrante est entièrement spécifique à la perception consciente.<br />

Troisièmement, un défaut de ré-entrance du cortex frontal vers le cortex temporal lors<br />

d’une stimulation auditive a pu être mis en évidence chez des patients en état végétatif<br />

(supposés non conscients) mais non chez des patients en état de conscience minimale<br />

(Boly et al., 2011).<br />

En parallèle à la description fine de ce corrélat neural, la théorie s’ancre sur le principe<br />

que l’étude scientifique de la conscience doit mettre sur un pied d’égalité les mesures<br />

neurales et comportementales, sans considérer ces dernières comme référence absolue.<br />

C’est l’argument de pureté neurale. L’exemple suivant illustre les problèmes engendrés<br />

par l’utilisation isolée d’un rapport hétéro-phénoménologique même correct du contenu<br />

conscient. Un patient souffrant d’un syndrome de déconnexion inter-hémisphérique (c’est<br />

à dire à qui l’on a sectionné tout ou partie du corps calleux) affirmera ne pas voir un mot<br />

présenté dans l’hémichamp visuel gauche, ce mot étant traité par l’hémisphère droit, isolé<br />

des aires cérébrales du langage latéralisées à gauche (Gazzaniga, 2005). En revanche, il<br />

sera capable de dessiner de la main gauche (commandée par l’hémisphère droit) ce que<br />

représente ce mot, puis de le nommer en voyant par la suite son dessin présenté dans<br />

l’hémichamp droit. Le patient a-t-il vu consciemment le mot en premier lieu ? L’utilisation<br />

stricte du critère de rapportabilité verbale l’infirmerait, et conduirait à la conclusion<br />

erronée qui ferait de l’entièreté de l’hémisphère droit une structure indépendante des<br />

corrélats neuraux de la conscience. Si l’utilisation couplée du critère neural et subjectif est<br />

sans doute bénéfique, il est important ici de ne pas confondre le critère de rapportabilité<br />

et le ressenti véritable. Premièrement, le rapport verbal n’est pas un critère absolu. Ainsi,<br />

si la qualité d’un stimulus n’est pas entièrement descriptible par le langage, il est tout<br />

de même possible d’en mesurer l’accès avec des méthodes objectives, par exemple le<br />

jugement de similarité. Deuxièmement, quand bien même un rapport n’est pas mesurable<br />

empiriquement, cela ne signifie pas l’absence d’accès conscient, par exemple chez un<br />

patient atteint du syndrome d’enfermement (locked-in syndrom) ayant perdu tout moyen<br />

de communiquer, et cependant tout à fait à même de ressentir des états mentaux et<br />

d’influer sur leur contenu.<br />

De manière similaire, un observateur portant son attention sur un distracteur échouera<br />

à rapporter la présence d’une texture, alors même que cette texture induit une activité<br />

neurale récurrente au sein des aires visuelles précoces (Scholte et al., 2006). Cela<br />

signifie-t-il que la ré-entrance n’est pas un facteur nécessaire et suffisant à l’expérience<br />

consciente ? Selon Victor Lamme (2006a), il s’agit là encore d’une confusion entre la<br />

mesure d’aptitudes cognitives (rapporter verbalement une texture lorsque celle-ci n’est<br />

22


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

pas attendue) et la mesure des corrélats de l’expérience phénoménologique pure, ici caractérisée<br />

par des boucles récurrentes locales au sein des aires visuelles précoces. Selon<br />

les termes proposés par Ned Block (2001), les patients cérébro-lésés comme les observateurs<br />

en condition d’inattention ont une conscience phénoménale du stimulus issue des<br />

boucles de ré-entrance locales, sans pour autant avoir les ressources nécessaires pour accéder<br />

consciemment à son contenu (conscience A, nécessitant des boucles de récurrentes<br />

antéro-postérieures globales) et rendre ainsi compte de toutes les facultés cognitives mesurées<br />

comportementalement (introspection, mémorisation, rapport verbal, etc.). Dans<br />

les deux cas, le ressenti n’est pas associé à la conscience phénoménale. Nous discuterons<br />

des problèmes soulevés par cette dissociation dans la sous section 1.3.3 page 26.<br />

1.3.2 Espace de travail neuronal global<br />

La théorie de l’espace de travail neuronal global (GNW, pour Global Neuronal Workspace)<br />

propose en premier lieu une architecture qui réconcilie un système cognitif modulaire,<br />

fait de multiples processeurs fonctionnant en parallèle (Fodor, 1983), avec l’idée que la<br />

conscience est avant tout caractérisée par ses propriétés intégratives (Baars, 2005). Pour<br />

être intégré, le système est considéré comme responsable de la coordination et du contrôle<br />

des échanges d’information, autorisant ainsi les modules à diffuser le produit de leur traitement<br />

à l’ensemble du cerveau. Selon Dehaene & Naccache (2001), c’est la disponibilité<br />

globale de l’information que l’on ressent subjectivement comme un état conscient. Ce<br />

protocole de communication spécifique à la cognition consciente associe donc de multiples<br />

réseaux de neurones autonomes, ou encapsulés, traitant une dimension particulière<br />

de l’information (par exemple l’orientation au sein de l’aire visuelle V1, ou le mouvement<br />

au sein de l’aire V5, voir sous-section 1.2). Selon le modèle, le fonctionnement isolé de ces<br />

modules est responsable des aptitudes cognitives non conscientes, pour lesquelles aucune<br />

expérience subjective n’est associée.<br />

Corrélant avec cette hypothèse,une étude a montré que les activités cérébrales associées<br />

au traitement d’un mot rendu non détectable par masquage visuel sont restreintes à l’aire<br />

visuelle de la forme des mots (VWFA, pour Visual Word Form Area) et ce indépendamment<br />

de la casse, ce qui suggère une reconnaissance invariante et non consciente du mot<br />

(Dehaene et al., 2001). Les influences résultant d’un traitements non conscient sont caractérisées<br />

par leur évanescence dans le temps (typiquement, l’influence disparaît au delà<br />

de 500ms, voir Dupoux et al., 2008; Mattler, 2005, mais voir Gaillard et al., 2009, pour<br />

des influences à plus long terme), et le fait qu’elles deviennent de plus faible amplitude à<br />

23


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

mesure que les niveaux cognitifs concernés mettent en jeu des processus de hauts niveaux<br />

(par exemple le traitement sémantique des mots, voir, Kouider & Dehaene, 2007, ou le<br />

contrôle exécutif, voir Lau & Passingham, 2007; van Gaal et al., 2008).<br />

En comparaison, la diffusion globale de l’information permet un traitement à la fois soutenu<br />

dans le temps et flexible, puisque il n’est pas encapsulé au sein d’un module cognitif<br />

spécifique, mais partagé par plusieurs modules, notamment spécialisés pour le rapport<br />

verbal, la mémoire, ou la planification à long terme. Ainsi, toujours dans l’exemple de la<br />

lecture, des mots visibles activent non seulement la VWFA, mais aussi un vaste réseau<br />

fronto-pariétal associé à l’espace de travail. Cet espace de travail est centralisé, il opère<br />

de manière sérielle, limitant donc la cognition consciente dans sa dynamique (on parle<br />

de goulot d’étranglement associé à l’accès conscient). Il peut être vu comme un protocole<br />

de communication, multipliant les combinatoires d’états neuraux et restituant ainsi<br />

la diversité de l’expérience consciente 4 . L’accès conscient opéré par l’espace de travail<br />

neuronal global est délimité par un seuil dynamique, qui fluctue à la fois selon des variations<br />

stochastiques pendant les premières étapes de traitement, mais aussi selon l’état<br />

du système avant sa stimulation. Le modèle prédit donc une transition entre traitement<br />

non conscient et expérience subjective en tout ou rien (Dehaene et al., 2003). Cela a pu<br />

être montré par des expériences de clignement attentionnel, dans lesquelles un stimulus<br />

constant oscille de manière binaire entre l’état perçu et non perçu (Sergent & Dehaene,<br />

2004).<br />

Deux prédictions fortes découlent de la théorie de l’espace de travail neuronal global.<br />

La première est qu’en principe, un stimulus subliminal ne peut pas être diffusé de manière<br />

soutenue au sein de l’espace de travail conscient. Cette limite a d’abord été mise<br />

à mal par plusieurs études, et notamment l’une d’entre elle montrant par électroencéphalographie<br />

(EEG) que des stimuli rendus invisibles par masquage peuvent induire une<br />

inhibition de réponse motrice en lien avec des activations dans le cortex préfrontal (stimuli<br />

no-go, sous-tendant donc un contrôle cognitif non conscient, van Gaal et al., 2008).<br />

Par la suite, la même mesure réalisée en imagerie par résonance magnétique fonctionnelle<br />

(IRMf), dont la résolution spatiale est plus importante que l’EEG, a finalement permis<br />

de montrer que les activités induites par les stimuli invisibles provenaient en fait de régions<br />

en dehors de l’espace de travail, incluant notamment l’aire motrice supplémentaire<br />

(van Gaal et al., 2011). En revanche, les mêmes stimuli perçus consciemment donnaient<br />

eux lieu à des activations dans des régions plus antérieures, incluant notamment le cortex<br />

4. La théorie du darwinisme neural postule que cette diversité provient à la fois d’un répertoire<br />

primaire, sélectionné pendant l’embryogenèse, et secondaire, sélectionné par interaction avec l’environnement<br />

(Edelman, 1993).<br />

24


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

cingulaire antérieur et des régions fronto-pariétales, typiquement considérées comme parties<br />

intégrantes de l’espace de travail. Si l’existence d’un contrôle cognitif non conscient<br />

semble avérée, la première prédiction faite par la théorie semble néanmoins résister aux<br />

observations des corrélats neuraux le sous-tendant.<br />

La deuxième prédiction est perturbationnelle : des interférences avec les régions frontopariétales<br />

sous-tendant l’espace de travail devrait moduler le contenu d’une expérience<br />

consciente associée. Si à l’heure actuelle le contenu n’est pas entièrement décodable par<br />

les techniques d’imagerie (voir Haynes & Rees, 2006 pour une revue de la littérature),<br />

l’étude de cas cliniques montre que des lésions fronto-pariétales modifient le niveau de<br />

conscience, en engendrant notamment des états de coma végétatif (Laureys, 2005). De<br />

manière plus fine, à l’aide d’un paradigme de masquage chez des patients présentant<br />

des lésions préfrontales focales, il a été montré une élévation du seuil perceptuel en<br />

corrélation avec l’étendue anatomique de la lésion (Del Cul et al., 2009). De manière<br />

critique, cette corrélation n’a pas été retrouvée lorsque les stimuli masqués n’étaient pas<br />

visibles, ce qui témoigne de la spécificité du rôle du cortex préfrontal pour la perception<br />

consciente 5 . Cette fois-ci chez une population non pathologique, plusieurs études<br />

utilisant la TMS suggèrent le rôle de plusieurs régions cérébrales antérieures pour la<br />

perception consciente. Notamment, l’inactivation du sulcus interpariétal impliqué dans<br />

l’amplification attentionnelle induit un effet d’estompement (Troxler fading), dans lequel<br />

un stimulus périphérique n’est plus accessible à l’expérience consciente (Kanai et al.,<br />

2008, voir Lamme, 2006b; Dehaene & Changeux, 2011 pour des revues de la littérature).<br />

A un niveau métacognitif, l’inactivation du cortex préfrontal réduit également le niveau<br />

de confiance des participants sur leur perception, tout en préservant leur performance<br />

objective sur le stimulus (Rounis et al., 2010). Ces premiers éléments, tout en restant<br />

indirects, appuient le rôle causal de l’espace de travail neuronal global pour la perception<br />

consciente.<br />

5. D’autres contrôles ont montré que les patients ne présentaient pas de déficits cognitifs globaux,<br />

notamment en ce qui concerne l’amplification attentionnelle.<br />

25


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.3.3 Dissociation entre conscience et attention endogène<br />

Nous pouvons définir de manière opérationnelle l’attention visuelle comme la sélection<br />

d’un attribut d’intérêt dans le temps ou l’espace, par l’amplification de son traitement,<br />

associée à l’inhibition de celui de ses distracteurs (Broadbent, 1958). La sélection présuppose<br />

que l’attribut ait été traité au moins en partie de manière automatique, la profondeur<br />

de ce traitement pré-attentionnel demeurant débattue (Treisman, 1985). Le filtrage attentionnel<br />

de l’environnement peut-être intentionnel, volontaire, il est alors dit endogène,<br />

mais également automatique, déclenché par l’apparition d’un stimulus saillant, il est alors<br />

dit exogène. La suite de nos travaux sur l’encombrement visuel se concentrera sur une<br />

modalité attentionnelle endogène dite couverte, ou la position du regard est décorrélée<br />

de la position attendue dans le champ visuel, à l’inverse de la modalité dite ouverte dans<br />

laquelle les deux positions sont confondues (Posner, 1980).<br />

Il semble à première vue qu’attention et conscience fonctionnent de manière synergique :<br />

la partie de l’environnement faisant l’objet d’une amplification attentionnelle endogène<br />

est accédée consciemment, et cet accès disparaît si l’attention est déportée sur une autre<br />

partie. Dès lors, émergent des phénomènes tels le clignement attentionnel (Raymond<br />

et al., 1992), dans lequel l’investissement cognitif sur un premier stimulus rend un stimulus<br />

successif invisible (ce dernier peut-être vu comme tombant dans une période réfractaire<br />

psychologique), ou la cécité inattentionnelle, dans laquelle une partie même saillante<br />

de l’environnement n’est pas perçue si elle est inattendue (Mack et Rock, 1998). Si chacun<br />

d’entre nous porte son attention sur ce qu’il peut accéder consciemment, et donc qu’il est<br />

pleinement conscient des événements attendus, cela signifie-t-il d’une part la nécessité<br />

de l’accès conscient pour l’amplification attentionnelle, et d’autre part la nécessité de<br />

l’attention pour l’accès à la conscience ?<br />

Afin de répondre à ces questions, la mise en œuvre d’une approche contrastive via laquelle<br />

les deux phénomènes sont étudiés indépendamment a été fructueuse (Koch & Tsuchiya,<br />

2007). D’une part, il a été clairement établi que l’accès conscient n’était pas nécessaire<br />

à l’amplification attentionnelle. Il ne fait plus aucun doute qu’il est possible d’amplifier<br />

attentionellement des stimuli visuels que l’on ne peut détecter (Naccache et al., 2002),<br />

ou discriminer consciemment (Montaser-Kouhsari & Rajimehr, 2005, Faivre & Kouider,<br />

2011, présent dans ce manuscrit chapitre 1 page 57). En revanche, la possibilité d’accéder<br />

consciemment à l’information sans attention endogène demeure très débattue. Affirmer<br />

cette possibilité requiert dans un premier temps de supprimer toute ressource attentionnelle<br />

lorsque le participant perçoit le stimulus d’intérêt, ce qui est loin d’être trivial dans<br />

26


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

la mesure où de multiples formes excédentaires peuvent y être allouées. Une manière de<br />

procéder consiste à exercer une charge attentionnelle, c’est à dire imposer au participant<br />

une tâche demandante en ressource cognitive, parallèlement à la tâche d’intérêt. En lien,<br />

il a été montré que des participants entraînés rapportaient percevoir consciemment l’essentiel<br />

(gist) de scènes naturelles présentées en périphérie du champ de vision (paysage,<br />

animaux, visages), leur performance pour les reconnaître étant élevée alors même que<br />

leurs ressources attentionnelles étaient allouées à une tâche centrale indépendante (Li<br />

et al., 2002). En revanche, une étude plus récente mettant en jeu des charges attentionnelles<br />

plus importantes a conclu que même si la moyenne de ces performances demeurait<br />

significativement au dessus du niveau du hasard, une proportion non négligeable d’essais<br />

étaient ratés du fait de l’inattention (Cohen et al., 2011).<br />

Ces résultats n’appuient donc pas une double-dissociation nette entre attention et conscience.<br />

Un argument de poids supérieur est peut-être le fait que l’amplification attentionnelle<br />

et l’accès conscient puissent avoir des conséquences opposées sur un même stimulus. En<br />

effet, un antagonisme entre attention et conscience a récemment été illustré en ce qui<br />

concerne la durée d’images consécutives 6 : le fait de porter attention à un stimulus, qu’il<br />

soit visible ou invisible a pour conséquence la diminution de la durée de son image consécutive,<br />

alors que le fait de percevoir consciemment un stimulus, qu’il soit attendu ou non<br />

attendu a pour conséquence son augmentation (van Boxtel et al., 2010).<br />

D’un point de vue théorique, dans le modèle de l’espace de travail neuronal global, l’amplification<br />

attentionnelle est considérée comme une fonction nécessaire à l’accès conscient,<br />

responsable à la fois de la mobilisation des modules spécialisés, et de la diffusion de leurs<br />

produits de traitement. Par conséquent, des entrées sensorielles de par nature suffisamment<br />

puissantes pour gagner l’espace de travail neuronal global ne seront pas accédées<br />

sans amplification attentionnelle. Ces modalités perceptuelles intermédiaires non attendues<br />

sont qualifiées de pré-conscientes (Dehaene et al., 2006). Elles rendent compte des<br />

phénomènes de clignement attentionnel et de cécité inattentionnelle. Dans la mesure<br />

ou l’encombrement aurait pour cause un déficit attentionnel en périphérie du champ de<br />

vision (voir sous-section 2.2.2 page 47), il incarnerait un cas typique et permanent de perception<br />

pré-consciente. Les relations entre attention, conscience et encombrement seront<br />

discutées dans le chapitre 2 page 188.<br />

La théorie de l’espace de travail neuronal global présuppose également que les régimes<br />

neuraux récurrents font partie intégrante des mécanismes associés à la diffusion globale<br />

6. C’est à dire des images illusoires qui demeurent perçues après que le stimulus physique a disparu,<br />

du fait de l’adaptation sensorielle.<br />

27


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

de l’information (voir Edelman et al., 2011, pour une tentative de synthèse entre espace<br />

de travail et ré-entrance). En revanche, le modèle définit que la modalité pré-consciente<br />

n’est pas associée à la diffusion des opérations au sein de l’espace de travail, et prédit<br />

donc qu’elle ne donne pas lieu à une expérience subjective. En revanche, l’interprétation<br />

forte de la théorie de la ré-entrance vue par Victor Lamme est dissociative. Elle suppose<br />

que la ré-entrance sous forme de boucles locales au sein du cortex sensoriel est présente<br />

lors de la modalité pré-consciente, et suffisante pour donner naissance à une expérience<br />

phénoménale. Les ressources sous-tendues par les régions fronto-pariétales n’étant pas<br />

disponibles il s’agit donc d’une conscience de type P, non accédée, et même non ressentie<br />

(Lamme, 2006a). Il est ainsi proclamé que la théorie de l’espace de travail neuronal global<br />

explique le fait d’accéder plutôt que celui de voir (Lamme, 2010).<br />

Pourtant, il semble que si même la conscience phénoménale ne donne pas lieu à une<br />

expérience ressentie par le sujet, la dissociation entre conscience phénoménale (problème<br />

difficile) et conscience d’accès (problème facile) demeure infalsifiable (Cohen & Dennett,<br />

2011). En effet, comment affirmer ou infirmer que des boucles de ré-entrance locales sont<br />

associées à une expérience phénoménale, si le sujet même n’a pas la sensation associée ?<br />

Comment distinguer ce régime d’un traitement non conscient de l’information ? Il semble<br />

que l’argument de pureté neurale, celui de poser comme critère à la phénoménologie<br />

un régime cérébral donné, s’apparente à une élimination matérialiste du problème. A<br />

l’inverse, la notion de pré-conscience fait sens dans la mesure ou elle définit opérationnellement<br />

une potentialité, tout en se gardant de postuler l’existence d’un état mental<br />

conscient non rapportable et non ressenti : il s’agit d’un régime neural qui n’est pas associé<br />

à une expérience subjective, mais qui, en présence d’amplification attentionnelle,<br />

pourrait y donner lieu. Cela constitue un point de divergence important entre les deux<br />

théories (voir Figure 1.2). Nous faisons l’assomption que l’étude de la conscience doit<br />

reposer sur des fonctions cognitives permettant l’expression du ressenti du sujet. Tout en<br />

conservant le modèle de la ré-entrance neurale comme mécanisme permettant la mise en<br />

relation de modules cognitifs associés à l’accès conscient, nous rejetons l’hypothèse d’une<br />

phénoménologie sans accès, qui selon nous repose sur un postulat non appréhendable par<br />

la méthode expérimentale.<br />

28


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

Figure 1.2: Comparaison des modalités perceptives proposées par les théories de l’espace de<br />

travail neuronal global et de la ré-entrance. Trois niveaux perceptuels sont distingués, en<br />

fonction de l’énergie du stimulus (ici un mot subliminal ou supraliminal), et de l’amplification<br />

attentionnelle (présente ou absente, représentée sur les schémas supérieurs par les flèches noires<br />

épaisses). Selon les deux théories, un stimulus subliminal non attendu sera traité de manière<br />

locale et non récurrente au sein de modules sensoriels spécialisés, alors que le traitement d’un<br />

stimulus supraliminal attendu sera caractérisé par une diffusion au sein de l’espace de travail, et<br />

par l’induction de boucles de ré-entrance globales entre les régions fronto-pariétales et le cortex<br />

sensoriel (représentées par les doubles flèches curvilignes). Le point de divergence se situe pour<br />

les stimuli supraliminaux non attendus. Si les deux théories prédisent des activations neurales<br />

plus intenses et plus prolongées dans le temps avec des boucles de ré-entrance locales au sein du<br />

cortex sensoriel, la première n’associe pas d’expérience subjective à la modalité pré-consciente,<br />

puisque l’espace de travail n’est pas mis en jeu. En revanche, la deuxième y associe une expérience<br />

consciente phénoménale, qui reste non rapportable en l’absence de boucles récurrentes globales.<br />

(Adapté de Dehaene et al., 2006; Lamme, 2006a).<br />

29


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.3.4 Théorie de l’intégration de l’information<br />

La théorie de l’intégration de l’information (IIT, Tononi & Edelman, 1998; Tononi, 2008)<br />

part d’une observation phénoménologique simple. Toute expérience subjective est d’une<br />

part différenciée, c’est à dire discernable de n’importe quelle autre expérience subjective.<br />

Toute expérience subjective est également intégrée, c’est à dire ressentie dans son intégralité<br />

comme unifiée, et non réductible à la somme de ses parties, tout comme le percept<br />

d’un carré rouge n’est pas dissocié en la perception d’une forme géométrique en parallèle<br />

à la perception d’une couleur.<br />

Selon le formalisme mathématique au coeur de la théorie, la quantité d’information intégrée<br />

Ф représente l’information générée par un ensemble d’opérateurs interconnectés au<br />

delà de l’information générée par la somme de ses parts. Une expérience de pensée illustre<br />

bien ce concept. De la même manière qu’un individu, une photodiode placée devant un<br />

écran qui s’allume et s’éteint alternativement est capable d’indiquer quand l’écran est<br />

en marche, et quand il ne l’est pas. Selon l’IIT, la différence entre ces deux entités tient<br />

en la différence quantitative d’information qu’elles génèrent. De la même manière qu’un<br />

dé lancé réduit l’incertitude de six états possibles à un état observé, une photodiode<br />

binaire réduit l’incertitude de deux états possibles à un état observé, et générera donc<br />

log 2 (2) = 1bit d’information (le dé génère lui log 2 (6) = 2.59bits d’information). L’individu<br />

conscient ne réduit pas l’incertitude entre deux alternatives, mais rejette toute<br />

l’immensité du répertoire des stimulations qu’il a rencontrées au cours de sa vie pour<br />

spécifiquement n’en retenir que l’état observé. En d’autres termes, la nature de la lumière<br />

captée par la photodiode n’est d’aucune importance à partir du moment où un<br />

seuil de détectabilité est atteint. En revanche, chez un individu conscient, c’est justement<br />

la faculté de discrimination au sein d’un répertoire de différentes alternatives qui<br />

corrèle selon l’IIT avec son niveau de conscience.<br />

La théorie propose donc que le niveau de conscience d’un mécanisme est reflété par sa<br />

capacité à discriminer de manière spécifique différentes alternatives. De manière cruciale,<br />

et à première vue contre-intuitive, le niveau de conscience est donc défini selon une<br />

potentialité : un système neural participant à la constitution du répertoire des états<br />

conscients influera sur le niveau de conscience même si ce dernier est inactif.<br />

Un capteur composé d’une assemblée d’un million de photodiodes génère 10 6 bits d’information,<br />

et peut donc discriminer entre 2 1000000 états, soit une immensité d’alternatives<br />

possibles. L’IIT prédit pourtant que sa valeur de Ф est nulle puisque chaque photodiode<br />

30


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

réalise localement une discrimination sans interaction avec ses voisines. La mesure de Ф<br />

d’un système résulte d’une comparaison entre le fonctionnement du système décomposé<br />

en ses parties minimales (soit la partition d’information minimale) et le système pris<br />

comme un tout. Ici, le capteur fonctionnant comme la somme d’un million de photodiodes<br />

sans que l’ensemble soit supérieur à la somme des parties, la différence est nulle,<br />

et l’information différenciée n’est donc pas intégrée, (cf. Balduzzi & Tononi, 2008, pour<br />

le formalisme utilisé dans le calcul de Ф, et Seth, Barrett, & Barnett, 2011, pour un état<br />

de l’art plus général en la matière).<br />

Comme pour la théorie de l’espace de travail neuronal global ou la théorie de la réentrance,<br />

l’IIT suppose que le mécanisme entraînant l’unité de l’expérience subjective<br />

implique l’existence d’interactions causales au sein du cerveau. L’ensemble fonctionne<br />

comme un système intégré, qui voit ses performances s’effondrer si les interactions sont<br />

empêchées. C’est typiquement ce qui est observé dans le sommeil profond, l’anesthésie,<br />

les états de coma végétatifs ou encore les absences épileptiques (voir Tononi & Koch,<br />

2008, pour une revue des liens entre états modifiés de conscience et IIT). En revanche, à<br />

la différence des deux théories précédentes qui fournissent un cadre matérialiste puissant<br />

sans définition universelle de la conscience présupposée, l’IIT est par essence axiomatique,<br />

et présuppose que la conscience est l’intégration de l’information. La conscience<br />

s’étend alors au sein d’un continuum entre des niveaux très faibles et des niveaux sans<br />

doute supérieurs à l’expérience humaine. S’il semble découler à première vue que l’IIT<br />

implique une vision panpsychiste du monde, où toute réalité matérielle est dotée d’une<br />

conscience, cela est nuancé par le fait que les valeurs élevées de Ф semblent restreintes<br />

à des singularités parmi lesquelles figurent l’architecture thalamo-corticale spécifique à<br />

la classe des mammifères (l’architecture cérébelleuse, elle, n’est pas favorable à l’intégration<br />

de l’information, ce qui corrèle avec la faible contribution de cette structure pour<br />

les corrélats neuraux de la conscience, cf. Balduzzi & Tononi, 2008). Même si à l’heure<br />

actuelle cela reste difficilement testable empiriquement, il est concevable que les théories<br />

de l’espace de travail neuronal global ou de la ré-entrance soient des opérationnalisations<br />

fonctionnelles de l’IIT.<br />

D’un point de vue empirique, des résultats préliminaires venus de l’étude du sommeil<br />

(Massimini et al., 2005) et de l’anesthésie (Ferrarelli et al., 2010) présagent de son pouvoir<br />

prédictif. Dans ces deux situations, la conscience semble s’évanouir alors même que les<br />

neurones demeurent réactifs, en accord avec l’IIT qui prédit que le taux ou la synchronie<br />

des décharges neuronales n’est pas un déterminant majeur de l’éveil ou l’évanouissement<br />

conscient. Une manière heuristique de sonder la capacité du cerveau à encoder de ma-<br />

31


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

nière intégrée un vaste répertoire d’informations consiste à perturber son fonctionnement<br />

par la TMS, puis d’en mesurer les conséquences par EEG. L’approche perturbationnelle<br />

par TMS est motivée par le fait qu’il est difficile d’affirmer qu’un système est intégré<br />

simplement en observant son activité spontanée. Par exemple, les corrélations au sein de<br />

séries temporelles d’un signal rétinien peuvent laisser penser que cet organe fait preuve<br />

d’intégration de l’information, alors que la perturbation de quelques cellules rétiniennes<br />

démontre qu’il fonctionne comme une somme de modules indépendants. A l’inverse, un<br />

cerveau conscient devrait être caractérisé par l’importance du répertoire des états qu’il<br />

peut prendre (différenciation), tout en étant non décomposable en modules causalement<br />

indépendants (intégration). Durant l’éveil, l’impulse de TMS au niveau du cortex prémoteur<br />

rostral induit des activités neurales oscillant d’abord à hautes fréquences (20 à<br />

35Hz) pendant les 100ms suivant l’impulse, puis à plus basse fréquence (8 à 12Hz) pendant<br />

encore 200ms. La reconstruction des patterns d’activité indique que ces derniers<br />

sont spatialement et temporellement différenciés, se propageant le long de connections à<br />

la fois ipsilatérales et trans-calleuses. Dès l’endormissement, la réponse évoquée par la<br />

TMS reste localisée autour du point de stimulation, sans propagation à grande échelle<br />

au sein du cerveau, et devient nulle dès 150ms après l’impulse. Cette approche perturbationnelle<br />

pour le moment qualitative indique que la perte de conscience semble découler<br />

d’une perte de connectivité fonctionnelle, c’est à dire l’interaction causale entre différents<br />

modules cérébraux censée opérationnaliser l’intégration de l’information.<br />

Si cette mesure objective de conscience se révèle à la fois normative, sensible et spécifique,<br />

elle devrait être capable d’évaluer le stade clinique de patients non-communiquants ainsi<br />

que de prédire leur pronostic de récupération. A l’heure actuelle, il demeure que ces faits<br />

empiriques sont interprétables de manière parcimonieuse en dehors de l’IIT, notamment<br />

sur les bases de l’espace de travail neuronal global.<br />

32


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

1.4 Inconscient cognitif et approche contrastive<br />

1.4.1 La conscience comme variable<br />

Afin d’identifier les corrélats neuraux de la conscience, c’est à dire l’ensemble minimal<br />

d’événements neuraux suffisant à l’occurrence d’un percept conscient précis (ci-après<br />

NCC, Koch, 2004), il est utile de comparer les influences neurales et psychologiques de<br />

stimulations supraliminales donnant lieu à un percept conscient, et subliminales, n’y<br />

donnant pas lieu. C’est la ligne suivie par l’approche contrastive qui vise à isoler les spécificités<br />

associées à l’accès conscient d’une information. Au cours de nos travaux, cette<br />

approche a été mise en œuvre pour comparer l’influence de la durée de stimulation sur<br />

la perception consciente et non consciente. Ainsi, nous avons pu isoler une spécificité du<br />

traitement conscient qui permet la prévention de l’habituation visuelle au cours du temps<br />

(voir le chapitre 5 page 147). A quelques exceptions près (Perruchet & Vinter, 2002; Holender<br />

& Duscherer, 2004), l’existence d’un traitement de l’information non conscient<br />

est maintenant globalement acceptée. La question est plutôt de savoir si ce dernier se<br />

différencie du traitement conscient de manière qualitative, comme nous l’avons vu avec<br />

les modèles de la ré-entrance et de l’espace de travail neuronal global, ou de manière<br />

quantitative, avec un continuum décrivant une augmentation de la profondeur des traitements<br />

en fonction de variables continues comme la saillance du stimulus (Cleeremans,<br />

2006). Les deux alternatives impliquent des prédictions différentes, notamment en ce qui<br />

concerne la longévité des représentations non conscientes (Dupoux et al., 2008).<br />

La réponse à cette question nécessite de comparer le plus purement possible des situations<br />

de perception consciente et non consciente. L’approche contrastive nécessite donc la mise<br />

en œuvre de manipulations visant à faire passer des stimuli au dessus (supraliminal) ou<br />

en dessous (subliminal) du seuil de perception. Au laboratoire, ces manipulations tirent<br />

profit des propriétés du système perceptuel. En ce qui concerne la vision, le masquage<br />

visuel est sans doute la méthode la plus utilisée. Il s’agit de rendre une image invisible<br />

en la présentant moins de 50ms précédée et suivie de patterns partageant avec elle des<br />

propriétés physiques (Breitmeyer, 2007). L’approche contrastive compare alors les états<br />

psychologiques ou neuraux associés à la perception d’un stimulus masqué et non masqué.<br />

On peut estimer la profondeur des traitements non conscients, c’est à dire la complexité<br />

de la dimension traitée du stimulus masqué alors même que ce dernier demeure invisible.<br />

Au cours des vingt dernières années, les limites de l’inconscient cognitif estimées via<br />

le masquage visuel n’ont eu de cesse d’être repoussées, avec l’accumulation de preuves<br />

33


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

concernant le traitement non conscient d’attributs physiques (contraste, couleur, orientation),<br />

lexicaux (reconnaissance des lemmes d’une langue donnée), et même sémantiques<br />

(relatifs au sens des mots, voir Kouider & Dehaene, 2007 pour une revue de la littérature).<br />

Une autre méthode tire profit de la rivalité binoculaire, faisant que des images en compétition<br />

présentées respectivement à l’œil droit et à l’œil gauche via un stéréoscope sont<br />

perçues non pas comme une chimère faite des deux images mais plutôt de manière alternative,<br />

le percept conscient oscillant entre les deux stimuli selon une distribution gamma<br />

(Tong et al., 2006). Plus récemment, une amélioration de la rivalité binoculaire appelée<br />

suppression par flashs continue (CFS) a été proposée, elle consiste à stimuler un œil avec<br />

le stimulus d’intérêt tandis que l’autre œil est intensément stimulé avec des patterns<br />

géométriques colorés appelés mondrians (Tsuchiya & Koch, 2005; Fang & He, 2005). En<br />

comparaison au masquage visuel, cette méthode présente l’avantage majeur d’une stimulation<br />

maintenue sous le seuil de conscience pendant des durées de plusieurs secondes. De<br />

la même manière que pour le masquage visuel, il est possible de comparer le traitement<br />

de stimuli perçus au traitement des mêmes stimuli dominés, ou supprimés par le CFS<br />

(Lin & He, 2009).<br />

Dans nos travaux expérimentaux, nous avons mis à profit le masquage et le CFS pour<br />

l’étude des propriétés du traitement non conscient d’expressions faciales. Qui plus est,<br />

nous avons comparé la profondeur de traitement autorisée par ces deux méthodes avec<br />

celle autorisée par l’encombrement (voir section 3 page 79). Nous considérons que des<br />

comparaisons méthodologiques systématiques sont nécessaires à l’estimation précise de<br />

la profondeur de l’inconscient cognitif. En effet, si la définition des NCC peut être inférée<br />

à partir du contraste entre cognition consciente et non consciente, il est crucial que les<br />

limites attribuées à la cognition non consciente émergent des propriétés intrinsèques du<br />

système, et non pas de limites méthodologiques. Nous reviendrons sur ce point dans la<br />

discussion.<br />

Même si notre travail se consacre aux manipulations perceptuelles du seuil de conscience,<br />

il est intéressant d’évoquer que l’approche contrastive peut également reposer sur d’autres<br />

situations. Tout d’abord, comme cité précédemment dans la sous-section 1.3.3 page 26,<br />

il est possible d’étudier via des manipulations attentionnelles le traitement de stimuli<br />

non perçus sous condition de clignement attentionnel, ou de cécité inattentionnelle. Par<br />

ailleurs, l’approche contrastive peut s’exercer à l’hôpital, notamment chez des patients<br />

atteints de lésion du cortex visuel et présentant des facultés dites de vision aveugle,<br />

chez des patients présentant classiquement des lésions dans le cortex pariétal postérieur<br />

34


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

droit, dits héminégligents, ainsi que pour des états altérés de conscience, tels le sommeil,<br />

l’anesthésie, ou le coma (Naccache, 2005).<br />

1.4.2 Mesurer l’inconscient cognitif<br />

Dans le cadre d’une approche contrastive, l’étude de l’inconscient cognitif est possible<br />

par la caractérisation des états neuraux ou cognitifs relatifs au traitement de stimuli<br />

non rapportables, dont on considère l’expérience subjective associée comme inexistante.<br />

Établir le traitement non conscient d’une information nécessite donc l’association d’une<br />

mesure directe de visibilité nulle à une mesure indirecte non nulle qui reflète ce traitement<br />

(Holender, 1986).<br />

Mesure indirecte de traitement non conscient<br />

De manière générale, les mesures indirectes de traitement non conscient reposent sur les<br />

conséquences de la stimulation subliminale sur le système perceptuel ou cognitif. Ces<br />

conséquences sont en majorité dues à une propriété cruciale de la réponse neurale : son<br />

adaptation (Kohn, 2007). Ainsi, le postulat est fait qu’il y a traitement non conscient<br />

d’une dimension du stimulus si la réactivité neurale associée à cette dimension change<br />

conséquemment à la présentation subliminale du stimulus. Forte de son pouvoir prédictif<br />

et descriptif, l’adaptation est considérée comme étant au psychophysicien ce que la microélectrode<br />

est à l’électrophysiologiste.<br />

Au niveau comportemental, l’adaptation donne notamment lieu au phénomène d’amorçage,<br />

dans lequel la dimension d’une cible est traitée plus efficacement si elle est précédée<br />

par une amorce même invisible partageant cette dimension. C’est donc la nature de la<br />

relation entre cible et amorce (physique, conceptuelle) qui permet d’inférer la profondeur<br />

du traitement non conscient étudié. L’amorçage a été abondamment mis à profit<br />

par l’approche contrastive, et notamment au sein de ce travail de thèse pour les études<br />

présentées en chapitres 1, 3, et 5. Au niveau neural, l’adaptation donne naissance aux<br />

phénomènes de suppression et d’augmentation à la répétition, dans lesquels l’activité cérébrale<br />

induite par le traitement de l’amorce est respectivement diminuée ou augmentée<br />

lors de la présentation d’une cible similaire. Cette approche a été mise à profit dans notre<br />

seconde étude en IRMf présentée en annexe 1 page 204.<br />

35


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

Mesure directe de visibilité<br />

Pour la modalité visuelle, la force du signal est corrélée à des caractéristiques physiques<br />

telles la luminance, le contraste, la durée de présentation, mais aussi à des caractéristiques<br />

contextuelles telles la situation dans le champ visuel, ou la présence de distracteurs.<br />

Les conditions les plus favorables à l’observation d’un traitement non conscient sont<br />

obtenues avec une stimulation de force maximale, qui reste néanmoins immédiatement<br />

sous le seuil de rapportabilité. Cette limite définit le seuil perceptuel. En fonction de<br />

l’objet d’étude, il peut s’agir du seuil de détectabilité, c’est à dire la limite en dessous de<br />

laquelle l’individu n’est plus capable d’indiquer la présence d’un stimulus, ou du seuil de<br />

discriminabilité, c’est à dire la limite en dessous de laquelle l’individu n’est plus capable<br />

de différencier les propriétés d’une cible selon une dimension (par exemple le contraste,<br />

l’orientation de lignes). Dans ce cas, et dans le cadre de l’hypothèse de conscience partielle<br />

(Kouider et al., 2010), c’est l’information critique sur laquelle repose le comportement<br />

étudié qui échappe au rapport conscient. Plutôt qu’un phénomène binaire en tout ou<br />

rien, l’expérience consciente est donc considérée comme un continuum au niveau duquel<br />

certains types d’informations sont accessibles tandis que d’autres ne le sont pas. Que ce<br />

soit pour la détection ou la discrimination, si l’on considère le signal comme l’activité<br />

issue du stimulus cible, et le bruit comme l’activité issue des distracteurs ou tout autre<br />

processus mental non corrélé à celui de la cible, il est à noter que du fait de la variabilité<br />

du rapport signal sur bruit, le seuil ne peut être déterminé que de manière probabiliste.<br />

Il convient donc d’être conservateur dans les mesures de visibilité employées, afin de<br />

s’assurer qu’aucun processus conscient n’interfère avec la mesure que l’on réalise.<br />

Mesures objectives Le plus souvent, on réalise une mesure dite objective de visibilité.<br />

A la fin de l’expérience visant à mesurer de manière indirecte le traitement non conscient,<br />

il est demandé au participant de réaliser une tâche sur la dimension étudiée du stimulus<br />

subliminal. Il peut par exemple être appelé à indiquer la présence ou non d’un stimulus<br />

(détectabilité), ou à choisir parmi deux alternatives le stimulus subliminal présenté<br />

au préalable (discriminabilité). Dans les deux cas, en se référant à la théorie de détection<br />

du signal (Macmillan & Creelman, 2004), il est possible de classer les réponses du<br />

participant en quatre catégories. Si l’on prend l’exemple simple de la détectabilité, on<br />

considérera une détection correcte (hit) comme l’indication correcte de la présence du<br />

stimulus, et une réjection correcte (correct rejection) comme l’indication correcte de l’absence<br />

du stimulus. L’ensemble de ces deux types de réponses est associé au signal détecté.<br />

Symétriquement, le bruit est associé à l’ensemble des fausses alarmes (false alarm), c’est<br />

36


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

à dire les indications de la présence du stimulus alors qu’il n’était pas présenté, et des<br />

détections manquées (miss), c’est à dire les indications de l’absence du stimulus alors<br />

qu’il était présent. La mesure de sensibilité (notée d’) reflète alors la séparation entre<br />

la moyenne des distributions du signal d’une part et du bruit d’autre part. Un stimulus<br />

est considéré comme subliminal lorsque le signal n’est pas distinguable du bruit, ce qui<br />

correspond à une valeur de d’ non significativement différente de zéro 7 .<br />

Mesures subjectives<br />

Le seuil de perception est également évaluable de manière subjective,<br />

c’est à dire en demandant au participant d’évaluer sa perception du stimulus.<br />

Cette aptitude repose directement sur l’introspection, c’est à dire l’accès à un contenu<br />

mental, assorti d’une certaine capacité à le communiquer à soi même ou à autrui. Sujet<br />

à débat au cours de l’histoire des sciences de la vie mentale (Sackur, 2009), le recueil de<br />

l’expérience subjective par introspection est crucial pour les théories non dissociatives<br />

de la conscience, pour lesquelles la phénoménologie sans ressenti rapportable n’est pas<br />

considérée (voir sous-section 1.3.3 page 26). Les mesures subjectives présentent l’avantage<br />

de pouvoir survenir simultanément à la mesure indirecte de traitement conscient, ce<br />

qui permet à posteriori d’analyser la mesure indirecte en plusieurs catégories de visibilité<br />

(Sergent et al., 2005; de Gardelle et al., 2010, ainsi que l’étude de ce travail de thèse présentée<br />

dans le chapitre 5 page 147). De plus, les mesures subjectives ne surestiment pas la<br />

perception consciente : dans de nombreux cas, comme la vision aveugle ou l’apprentissage<br />

implicite, les participants ont un d’ supérieur à zéro alors même qu’ils confessent ne pas<br />

percevoir le stimulus. Par ailleurs, il arrive parfois que l’on s’écarte du critère absolu de<br />

nullité du d’, ce dernier étant dépendant à la fois de la tâche précise utilisée et du nombre<br />

d’essais pour le test objectif. Par régression linéaire, on peut alors estimer ce que serait<br />

la mesure indirecte pour une valeur de d’ nulle (Greenwald et al., 1995).<br />

Le recueil d’une expérience subjective est réalisable selon plusieurs méthodes, de manière<br />

directe ou indirecte, la plupart du temps sans faire appel au langage. Premièrement, on<br />

peut recueillir la qualité du percept, indiqué sur une échelle graduée après chaque essai.<br />

Cette échelle peut-être linéaire, mais aussi graduée en fonction de description précise<br />

donnée préalablement au participant (échelle de conscience perceptuelle, Sandberg et al.<br />

2010). Avec le même type d’échelle, on peut également recueillir le niveau de confiance<br />

dans la réponse du participant, il s’agit alors d’une tâche métacognitive, dite de second<br />

7. Un autre indice utilisé dans la théorie de la détection du signal est le critère, qui reflète la tendance<br />

plutôt libérale (c’est à dire répondre qu’un stimulus est présent en présence d’une évidence faible) ou<br />

conservatrice (c’est à dire répondre qu’un stimulus est présent en présence d’une évidence forte) du<br />

participant dans sa manière de répondre. Critère et d’ sont deux mesures indépendantes.<br />

37


CHAPITRE 1.<br />

CONSCIENCE ET INCONSCIENT COGNITIF<br />

ordre. Le recueil du niveau de confiance peut se faire de manière indirecte, comme dans<br />

le pari post-décisionnel, où le participant met en jeu un montant d’argent en fonction de<br />

sa performance sur la tâche objective de visibilité, qu’il gagnera si sa réponse est bonne,<br />

et perdra si elle est mauvaise (Kunimoto et al., 2001; Persaud et al., 2007). La corrélation<br />

entre les montants pariés et la performance objective, d’abord considérée comme<br />

signature de l’accès conscient, réfère sans doute plus aux connaissances métacognitives<br />

qu’a le participant sur la confiance qu’il a en son jugement (Seth, 2008). En ce sens, cette<br />

mesure a permis la validation de l’existence de capacités métacognitives chez l’animal<br />

non humain (Kornell et al., 2007). Ces méthodes présentent des sensibilités variables aux<br />

conditions de faibles signaux, et encore une fois le conservatisme est de rigueur dans ces<br />

situations (Sandberg et al., 2010).<br />

38


2 L’encombrement comme sonde de<br />

l’inconscient cognitif<br />

2.1 Faits empiriques<br />

Depuis la détection photonique par un photo-récepteur jusqu’à la reconstruction perceptuelle<br />

d’un objet le long de la voie ventrale, nous avons brossé le portrait global d’un<br />

système visuel qui, pour des raisons écologiques à première vue pertinentes (voir la soussection<br />

2.3 page 50), n’alloue pas les mêmes ressources au traitement du centre et de<br />

la périphérie du champ de vision. Voyons maintenant du point de vue de l’expérience<br />

subjective ce qu’il advient de stimuli situés en périphérie. En 1923, Korte rapporte ce<br />

qu’il ressent à la lecture d’un mot périphérique.<br />

« C’est comme s’il y avait une pression qui compressait le mot de chaque<br />

côté. Les lettres les plus saillantes ou dominantes sont préservées, et elles<br />

écrasent les plus faibles, c’est à dire les moins saillantes, situées au milieu. »<br />

C’est la première description de ce que Stuart & Burian (1962) appelleront plus tard<br />

l’encombrement (crowding, voir Pelli & Tillman, 2008; Levi, 2008; Whitney & Levi, 2011<br />

pour des revues récentes de la littérature). Six propriétés principales caractérisent ce<br />

phénomène.<br />

Détection sans discrimination. Comme le soulignait Korte, l’encombrement témoigne<br />

du fait qu’un stimulus, qu’il s’agisse d’une ligne orientée, d’une lettre, d’un symbole ou<br />

d’un visage, dès lors qu’il est présenté dans la périphérie du champ de vision à proximité<br />

d’autres stimuli qui lui sont semblables, n’est plus reconnaissable. Comme si certaines<br />

parties du stimulus en écrasaient d’autres, ou que l’ensemble se mélangeait en une texture<br />

indiscernable (voir figure 2.1 pour des exemples). En revanche, ce n’est pas comme si le<br />

39


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

stimulus disparaissait complètement. Il est en effet possible de détecter la présence du<br />

stimulus, mais pas de discriminer sa nature 1 . Cette dichotomie est à la base d’un modèle<br />

en deux étapes dans lequel les traits des objets sont d’abord traités indépendamment, puis<br />

intégrés au sein d’une représentation unifiée, cette dernière étape étant celle perturbée<br />

dans l’encombrement (voir section 2.2 page 42).<br />

Espacement critique. En 1970, Bouma définit et donne son nom à la première caractéristique<br />

psychophysique de l’encombrement : un stimulus périphérique est encombré<br />

lorsque ses voisins sont situés à une distance inférieure à environ la moitié de son excentricité,<br />

appelée espacement critique, et mesurée du centre du stimulus cible au centre<br />

de son voisin. Ainsi si l’on nomme ∆ ϕ l’espacement critique, b la constante de Bouma<br />

(environ 0.5), et φ l’excentricité, on a :<br />

∆ ϕ = b × ϕ (2.1)<br />

De manière surprenante, l’encombrement n’est pas sensible à la taille du stimulus cible,<br />

c’est à dire que l’espacement critique n’est proportionnel qu’à l’excentricité du stimulus,<br />

et reste à peu près constant si l’ensemble du dispositif est agrandi (Tripathy & Cavanagh,<br />

2002), à l’inverse du masquage qui est décrit comme dépendant de la taille du stimulus<br />

mais pas de l’excentricité (Pelli et al., 2004). Ce phénomène est directement testable sur<br />

la Figure 2.1, et sert de critère diagnostique objectif pour différencier l’encombrement du<br />

masquage latéral. Des résultats récents montrent tout de même une possible réduction<br />

de l’encombrement d’une cible en augmentant la taille de ses voisins, sans doute par<br />

diminution de la similarité cible - voisin (Levi & Carney, 2009).<br />

En effet, il est décrit que l’espacement critique est réduit lorsque le stimulus et ses voisins<br />

sont semblables en terme de forme, de taille, d’orientation, et de fréquence spatiale.<br />

L’encombrement existe également pour l’information de colorimétrie, de teinte et de saturation,<br />

mais dans une moindre mesure (Van den Berg et al., 2007). Par ailleurs, si,<br />

lorsqu’il est supérieur à deux, le nombre de voisins similaires n’est pas déterminant, leur<br />

configuration globale influe sur l’espacement critique. Notamment le fait que des voisins<br />

orientés puissent être regroupés par co-circularité (c’est à dire que leurs orientations<br />

1. Cependant, une étude récente a nuancé cette dichotomie en montrant que l’encombrement pouvait<br />

perturber la détection d’une cible lorsque celle-ci était couplée spatialement ou temporellement à du<br />

bruit visuel (Allard & Cavanagh, 2011). Si l’encombrement n’impacte pas la détection en l’absence de<br />

bruit visuel, les auteurs suggèrent que dans leur expérience, la présence de bruit induit un glissement<br />

stratégique qui amène à essayer de discriminer la cible pour la détecter.<br />

40


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

successives définissent un cercle) ou co-linéarité (c’est à dire que leurs orientations successives<br />

définissent une ligne) augmente l’espacement critique, et donc diminue le degré<br />

d’encombrement (Saarela et al., 2009; Livne & Sagi, 2007, 2010).<br />

Anisotropie. Comme le remarquait déjà Bouma, l’espacement critique n’est pas isotrope<br />

dans le champ visuel, puisque des voisins agencés radialement par rapport à la<br />

cible auront un effet plus drastique sur sa discriminabilité que les mêmes voisins agencés<br />

tangentiellement (Toet & Levi, 1992; Intriligator & Cavanagh, 2001). On estime en effet<br />

que l’espacement critique tangentiel ∆ϕ t est environ deux fois plus faible que l’espacement<br />

critique radial ∆ϕ r (voir figure 2.1). Ainsi, si l’on mesure la position des voisins<br />

respectant l’espacement critique dans différentes régions visuelles, nous obtenons des fenêtres<br />

plus allongées dans la direction radiale que tangentielle, avec une ellipticité environ<br />

égale à deux.<br />

Asymétrie. Avec une même excentricité, un voisin radial situé en dehors du stimulus<br />

cible réduit plus fortement sa discriminabilité que le le même voisin situé en dedans. A<br />

première vue contre-intuitif, ce phénomène se retrouve à différents niveaux hiérarchiques<br />

d’encodage, allant des lignes orientées (Petrov et al., 2007) jusqu’aux visages (Farzin<br />

et al., 2009), en passant par les lettres (Banks et al., 1977). Cela s’explique sans doute<br />

par le fait que du point de vue rétinotopique, le voisin en dehors est situé plus proche de<br />

la cible que le voisin en dedans (Motter & Simoni, 2007).<br />

Inhomogénéité. Anisotrope, et asymétrique, l’encombrement est également inhomogène<br />

selon les deux axes du champ visuel. Les espacements critiques sont en effet plus<br />

élevés dans l’hémichamp supérieur et dans l’hémichamp gauche, témoignant d’une sensibilité<br />

à l’encombrement plus grande dans ces régions de l’espace (He et al., 1996).<br />

Indépendance temporelle. Enfin, une dernière propriété fondamentale de l’encombrement<br />

est que le temps de visualisation ne permet pas de restaurer la discrimination (Kooi<br />

et al., 1994). Nous avons mis à profit cette propriété dans nos travaux en manipulant<br />

indépendamment la durée de stimulation et la discriminabilité de stimuli encombrés,<br />

afin d’étudier le rôle respectif de l’évidence sensorielle et de l’accès conscient pendant<br />

l’adaptation sensorielle (voir chapitre 5).<br />

41


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

Figure 2.1: Exemples de stimuli encombrés. Sur la figure de gauche, des stimuli centraux de différentes<br />

catégories sont entourés par des voisins similaires. En fixant la croix grise, l’espace inter-stimulus<br />

est supérieur à l’espacement critique, le stimulus central est alors discriminable. En fixant le<br />

tiret rouge, l’excentricité augmente et l’espacement n’est plus suffisant, ce qui rend le stimulus<br />

central encombré et donc non discriminable. (Adapté de Pelli & Tillman, 2008). Sur la figure<br />

du milieu, la lettre W est entourée de voisins X respectant l’espacement critique. Lorsque les X<br />

sont agencés tangentiellement au W, l’espacement critique ∆ϕ t est environ deux fois plus faible<br />

que ∆ϕ r, l’espacement critique de X agencés radialement au W. L’encombrement est donc plus<br />

sévère dans la direction radiale que tangentielle. Sur la figure de droite, les fenêtres spatiales<br />

respectant l’espacement critique sont tracées à différents endroits du champ visuel, illustrant le<br />

caractère anisotrope et inhomogène de l’encombrement.<br />

2.2 Théories de l’origine de l’encombrement<br />

En premier lieu, l’observation de l’encombrement lorsqu’un stimulus et ses voisins sont<br />

respectivement présentés dans un œil différent falsifie les théories d’origines rétiniennes.<br />

L’occurrence la plus précoce de l’encombrement doit se trouver au niveau du site de<br />

recombinaison binoculaire 2 , c’est à dire au niveau de V1 (Hubel & Wiesel, 1962; Parker,<br />

2007). Il convient de distinguer la résolution visuelle, c’est à dire l’espacement résolu<br />

le plus fin entre des lignes de contraste maximal (typiquement obtenu avec des lignes<br />

alternant cinquante cinq fois sur un degré d’angle visuel, Campbell & Gubisch, 1966),<br />

et la résolution de discrimination, qui permet d’accéder aux éléments individuels pour<br />

les manipuler et ainsi les reconnaître, les compter, ou les suivre des yeux. Intriligator<br />

2. On peut définir ce site de manière opérationnelle par le fait qu’il contient des champs récepteurs<br />

sensibles à des afférences provenant à la fois de l’œil gauche et de l’œil droit.<br />

42


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

& Cavanagh (2001) ont quantifié que cette résolution, ici qualifiée d’attentionnelle, était<br />

cinq fois plus basse que l’acuité visuelle dans la fovéa, et trente fois plus mauvaise à<br />

quinze degrés d’excentricité. Au delà de cette résolution, les éléments sont vus, mais<br />

l’individualité de chacun est inaccessible, ce qui donne lieu à l’encombrement.<br />

Parmi les différentes théories que nous décrirons ci-dessous, un consensus semble émerger,<br />

dans lequel l’encombrement est décrit comme intrinsèque au mécanisme de liage<br />

(binding). Ce dernier donne lieu au caractère unifié de la représentation perceptuelle, par<br />

laquelle un objet contenu dans l’environnement n’est pas perçu comme une multitudes<br />

de traits épars (couleur, orientation, contour, etc.), mais comme un tout unifié. Si les<br />

bases neurales du liage sont encore incertaines (voir Velik, 2010 pour une revue de la<br />

littérature), son principe et plus récemment son application à l’encombrement sont largement<br />

acceptés. Dans ce cadre, les différents traits d’un objet sont d’abord encodés par<br />

des neurones le long de la voie visuelle ventrale, puis liés dans une fenêtre d’intégration,<br />

ou de combinaison en un objet unifié. Les fenêtres d’intégration sont distribuées afin<br />

de couvrir l’ensemble du champ visuel, avec un accroissement de leur taille proportionnelle<br />

à l’excentricité 3 . Il en découle que la probabilité que deux objets soient liés dans la<br />

même fenêtre d’intégration augmente avec leur excentricité dans le champ visuel. Si la<br />

fenêtre est plus grande que le stimulus cible, il se produit alors une conjonction illusoire,<br />

c’est à dire une intégration de traits provenant d’objets différents au sein d’une même<br />

chimère. L’objet ainsi créé apparaît brouillé, jusqu’à devenir non discriminable sous certaines<br />

conditions. En lien avec cette idée, une étude a montré que la résolution pour<br />

discriminer la contingence de deux traits périphériques (par exemple une ligne orientée<br />

et colorée) était moins bonne que pour discriminer isolément chacun des deux traits (Neri<br />

& Levi, 2006).<br />

L’opérationnalisation de ce schéma en deux étapes (encodage de traits uniques et intégration)<br />

reste aujourd’hui débattue, et c’est l’objet des dissensions entre les deux familles<br />

de théories décrites ci-dessous.<br />

3. Cet accroissement, ou glissement d’échelle permet de conserver une bonne sensibilité aux basses<br />

fréquences spatiales en périphérie du champ de vision (Levi & Waugh, 1994) tout en utilisant des ressources<br />

neurales réduites. Cet argument d’économie neurale semble pertinent puisque pour compenser,<br />

les saccades oculaires permettent d’apporter un objet d’intérêt à la fovéa pour un traitement plus fin de<br />

l’information.<br />

43


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

2.2.1 Théorie ascendante et perte d’information<br />

Selon la théorie ascendante (bottom-up) de l’encombrement, les fenêtres d’intégration sont<br />

matérialisées au niveau du cortex visuel primaire, elles induisent une interférence entre les<br />

traits élémentaires de bas niveau (par l’exemple l’orientation) de plusieurs objets activant<br />

le champ récepteur d’un même neurone. Diverses mesures montrent que la position d des<br />

neurones activés dans V1 est proportionnelle au logarithme de l’excentricité φ de l’objet<br />

correspondant dans le champ visuel, avec α et β des constantes propres aux propriétés<br />

histologiques de V1 (Engel et al., 1997).<br />

d = log ϕ<br />

β − α (2.2)<br />

Si l’on estime maintenant ∆ D l’espacement critique histologique, c’est à dire implémenté<br />

physiquement dans V1, on a :<br />

∆ D = d ϕ+bϕ − d ϕ =<br />

log(1 + b)<br />

β<br />

(2.3)<br />

Il en résulte que l’espacement critique histologique ∆ D est indépendant de l’excentricité<br />

dans le champ visuel. Ainsi, des estimations suggèrent que des objets encodés par des<br />

neurones de V1 à l’intérieur de fenêtres distantes de moins de 6mm selon l’axe radial<br />

et 1mm selon l’axe tangentiel seront encombrés (Pelli, 2008). Il est à noter qu’à notre<br />

connaissance, aucun enregistrement physiologique publié n’appuie ces estimations à ce<br />

jour.<br />

Plusieurs implications découlent d’une interprétation purement ascendante de l’encombrement.<br />

La première, est que les influences sur le phénomène de l’encombrement ne<br />

devraient se limiter qu’aux caractéristiques physiques du stimulus, et principalement son<br />

respect ou non du critère de la loi de Bouma, c’est pourquoi elle est souvent dénommée<br />

ascendante, ou bottom-up. Ainsi des influences de haut niveau, par exemple contextuelles<br />

ou attentionnelles ne devraient pas modifier la taille des fenêtres d’intégration et donc<br />

en conséquence l’espacement critique. Qu’en est-t-il ?<br />

L’influence de l’indiçage attentionnel sur l’espacement critique est débattue. Globalement,<br />

les études montrent que le fait d’attirer l’attention spatiale par indiçage à l’endroit<br />

de la cible encombrée augmente la capacité à la discriminer, ce par augmentation du<br />

44


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

rapport signal sur bruit par l’amplification de la cible couplée à l’inhibition des voisins<br />

(Desimone & Duncan, 1995). En revanche, certaines de ces études montrent que l’amplification<br />

attentionnelle ne réduit pas l’espacement critique (Scolari et al., 2007), ou<br />

uniquement pour des degrés d’encombrement faibles (par exemple pour des excentricités<br />

inférieures à 4° dans l’étude de Strasburger, 2005 ; ou des espacements entre cibles et voisins<br />

supérieurs à 2° dans l’étude de Felisberti et al. 2005). Cela semble donc aller en faveur<br />

des théories ascendantes. Une étude plus récente (Yeshurun & Rashal, 2010) montre en<br />

revanche que l’indiçage réduit l’espacement critique jusqu’à 9° d’excentricité, ce qui argumente<br />

plutôt en faveur des théories descendantes proposant que l’encombrement reflète<br />

la résolution spatiale de l’attention (voir section 2.2.2 ci-dessous). Le rôle de l’attention<br />

exogène sur l’espacement critique reste donc à préciser. Par ailleurs, l’influence de l’attention<br />

endogène (intentionnelle, agissant à plus long terme) sur l’espacement critique<br />

reste à explorer.<br />

A un autre niveau, il a été montré que la perception de lettres périphériques encombrées<br />

pouvait être améliorée par un entraînement durant six jours (Chung, 2007). La théorie<br />

ascendante postule que ce phénomène d’apprentissage comme les effets de l’amplification<br />

attentionnelle doivent provenir d’une réduction de la taille des champs récepteurs au<br />

niveau des aires visuelles précoces. Cela devra être vérifié par des mesures électrophysiologiques.<br />

La deuxième implication de la théorie ascendante de l’encombrement est la perte d’information<br />

contenue dans les stimuli encombrés. Si l’on imagine deux objets d’orientations<br />

opposées suffisamment proches dans l’espace pour que leurs représentations perceptuelles<br />

respectives soient établies au sein de la même fenêtre d’intégration, l’objet chimérique<br />

constitué contiendra la somme de ces deux orientations, les informations individuelles<br />

étant perdues pour la chaîne de traitement située en aval. Il y aurait alors concordance<br />

entre l’expérience subjective que l’on a d’un stimulus encombré, et le contenu informatif<br />

qu’il renferme.<br />

Il est intéressant de réfléchir à ce problème selon la notion de métamérisme, c’est à dire<br />

le fait que deux stimuli physiquement distincts soient perçus comme identiques. Comme<br />

pour le métamérisme chromatique qui provient d’une perte d’information au niveau de<br />

l’encodage rétinien du spectre lumineux (Conway, 2009), le métamérisme en vision périphérique<br />

doit provenir d’une perte de l’information au niveau des étapes corticales du<br />

traitement visuel. En lien, Freeman et Simoncelli (2011) ont proposé que deux scènes<br />

visuelles qui diffèrent uniquement selon l’information périphérique perdue doivent apparaître<br />

identiques. A l’aide d’un modèle de traitement d’image réalisant une intégration de<br />

45


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

l’information au sein de fenêtres dont la taille augmente avec l’excentricité, les auteurs ont<br />

généré deux versions dégradées d’une même scène visuelle complexe (voir figure 2.2). Présentées<br />

successivement à des participants, les deux versions se sont révélées métamériques<br />

puisque indistinguables l’une de l’autre. Les auteurs ont montré que le métamérisme périphérique<br />

était obtenu lorsque le modèle utilisait des fenêtres d’intégration respectant le<br />

critère d’espacement critique histologique de l’aire visuelle V2. Enfin, ils ont également<br />

montré que la taille de ces fenêtres d’intégration était indépendante à la fois de la durée<br />

de présentation du stimulus, et de l’indiçage attentionnel. Ce modèle appuie donc<br />

la théorie ascendante de l’encombrement, par la perte d’information visuelle lors de la<br />

perception encombrée.<br />

Figure 2.2: Métamères en vision périphérique. A gauche, une image originale de scène visuelle complexe.<br />

A droite, deux métamères générés par le modèle de Freeman & Simoncelli. Lorsque les images sont<br />

visualisées en fixant le point central rouge, elles sont indistinguables les unes des autres malgré<br />

d’importantes différences physiques en périphérie. Elles sont donc qualifiées de métamériques.<br />

(Adapté de Freeman & Simoncelli, 2011).<br />

En établissant une dissociation entre le ressenti subjectif et le traitement objectif de<br />

l’information encombrée, les résultats contenus dans ce travail de thèse vont à l’encontre<br />

d’une perte totale de l’information encombrée au sein des voies visuelles, et donc d’une<br />

interprétation purement ascendante du phénomène d’encombrement. En revanche, l’existence<br />

de fenêtres d’intégration histologiques dans V1 n’est pas falsifiée, puisque leur observation<br />

aurait nécessité des mesures physiologiques d’une résolution supérieure à celles<br />

permises par les techniques d’IRMf que nous avons utilisées.<br />

46


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

2.2.2 Théorie descendante et déficit attentionnel<br />

Selon la théorie descendante (top-down) de l’encombrement, dite de haut-niveau, la taille<br />

des fenêtres d’intégration corrèle avec la résolution spatiale de l’attention. Cette théorie<br />

s’appuie notamment sur une interprétation attentionnelle du problème du liage, proposée<br />

par Treisman & Gelade (1980). Elle stipule que les différents traits d’un objet sont traités<br />

de manière précoce et automatique, l’intégration se faisant de manière plus tardive et<br />

sérielle de part le focus attentionnel. L’attention peut alors être vue en analogie avec<br />

un faisceau lumineux, qui, se déplaçant au sein du champ de vision, intègre tous les éléments<br />

qu’il éclaire en un objet unifié 4 . Selon Intriligator & Cavanagh (2001), les fenêtres<br />

d’intégration sont opérationnalisées par le focus attentionnel, et l’encombrement aurait<br />

pour origine une baisse de sa résolution en périphérie du champ de vision. Ce postulat<br />

s’appuie sur des expériences de poursuite attentionnelle, dans lesquelles il est demandé<br />

aux participants de se concentrer sur une cible en mouvement parmi des distracteurs<br />

sans bouger les yeux (attentive, ou covert tracking). En périphérie, lorsque la distance<br />

cible-distracteur diminue et alors même que l’acuité visuelle est suffisante pour discerner<br />

chaque stimulus, les performances sur la poursuite s’effondrent. Si la résolution optique<br />

est conservée, c’est le déclin de la résolution attentionnelle en périphérie qui explique cet<br />

effondrement, de par le fait que les éléments ne sont plus isolables, leurs positions précises<br />

étant inaccessibles. Selon les auteurs, le facteur déterminant est donc la perte d’accès à la<br />

position, et non pas la perte de l’information des propriétés visuelles à cette position. Le<br />

caractère inhomogène de la résolution attentionnelle dans le champ visuel a pu également<br />

être estimé dans cette étude, avec, comme pour l’encombrement, des performances moins<br />

bonnes dans l’hémichamp supérieur et dans l’hémichamp gauche.<br />

La théorie descendante pose l’encombrement comme un phénomène post-attentionnel,<br />

arrivant tardivement le long de la voie de traitement visuel, à l’inverse de son homologue<br />

ascendante qui postule un rôle causal architectural des premières aires visuelles<br />

du cortex. Plusieurs résultats empiriques viennent appuyer cette origine tardive. Même<br />

si la réduction de l’espacement critique par l’attention exogène demeure débattue (voir<br />

section 2.2.1 ci-dessus), d’autres phénomènes spécifiques à l’encombrement sont modulés<br />

par l’attention.<br />

Tout d’abord, il a été observé que l’attention endogène pouvait annuler, et même inverser<br />

la propriété anisotrope qui caractérise l’encombrement (Petrov & Meleshkevich, 2011).<br />

4. L’analogie, bien que séduisante, ne résiste pas entièrement aux données empiriques, voir Cave &<br />

Bichot (1999) pour une discussion complète à ce sujet.<br />

47


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

Une autre étude (Chakravarthi & Cavanagh, 2007) a utilisé l’alternance du contraste<br />

d’une cible et de ses voisins à des fréquences variables, de telle manière à ce que les<br />

stimuli oscillent en phase ([cible blanche - voisins blancs] puis [cible noire - voisins noirs]<br />

etc.), ou en opposition de phase ([cible blanche - voisins noirs] puis [cible noire - voisins<br />

blancs] etc.). La cible étant indiscriminable en oscillation phasique, les participants deviennent<br />

capable de la discriminer en oscillation anti-phasique de fréquences basses (2 et<br />

3.75Hz). De manière critique, cet avantage disparaît à des fréquences d’oscillations plus<br />

élevées (7 et 15Hz). En reliant cette observation au fait que la résolution temporelle de<br />

l’attention est d’environ 6 à 8Hz, les auteurs suggèrent un rôle causal de l’attention dans<br />

l’encombrement, et confèrent au phénomène d’intégration des différents traits de l’objet<br />

une origine tardive, post-attentionnelle.<br />

En ce qui concerne le locus de l’encombrement, une autre étude récente (Chakravarthi<br />

& Cavanagh, 2009) a évalué le locus d’intégration d’une cible encombrée en dégradant<br />

le signal visuel évoqué par ses voisins par différentes techniques de masquage. Alors<br />

que la dégradation du signal issu des voisins par du masquage intervenant à bas niveau<br />

(respectivement masquage par bruit et métacontraste) délivre de l’encombrement et rend<br />

la cible discriminable, la dégradation par du masquage de plus haut niveau (substitution<br />

d’objet par quatre points) n’a pas de conséquence sur la discriminabilité de la cible.<br />

Ce travail élégant renvoie le locus d’intégration de la cible et de ses voisins entre les<br />

loci d’occurrence du masquage par métacontraste et substitution d’objet, soit d’après<br />

des études récentes en imagerie entre V1 et le cortex occipital latéral (LOC) (Carlson<br />

et al., 2007). Une étude limitant l’accès conscient des voisins cette fois par la méthode<br />

d’adaptation visuelle (cécité induite par adaptation) tire les mêmes conclusions (Wallis<br />

& Bex, 2011). Nous reviendrons dans le chapitre 1 page 178 sur le locus, voire les loci de<br />

l’encombrement.<br />

Par ailleurs, la théorie descendante implique une prédiction forte, à savoir que l’information<br />

encombrée, plutôt que d’être perdue précocement, est inaccessible au rapport<br />

conscient car inattendue. En lien avec cette prédiction, certains ont postulé l’existence<br />

d’une phénoménologie du contenu encombré, sans que les ressources attentionnelles nécessaires<br />

pour y accéder soient présentes (Block, 2001). De manière objective et mesurable,<br />

l’information devrait dans ce cas faire l’objet d’un traitement plus ou moins élaboré le<br />

long des voies visuelles. Le premier résultat en ce sens (He et al., 1996), séminal, montre<br />

par une mesure d’effet consécutif que l’orientation d’un stimulus encombré est traitée,<br />

bien qu’elle soit non discriminable au vu de mesures objectives (voir figure 2.3).<br />

Comme précisé dans la sous-section 1.2 page 16, l’orientation est codée à partir du cor-<br />

48


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

Figure 2.3: Adaptation à l’orientation en fonction de l’encombrement. En haut, alors que des participants<br />

fixant la croix à gauche sont préalablement exposés à un stimulus adaptateur isolé<br />

(dont l’orientation est perçue consciemment), on mesure que le contraste associé au seuil de perception<br />

d’une cible subséquente partageant la même orientation augmente (passant de 5% sans<br />

adaptation, à 15%). Cet exemple est un cas typique d’adaptation visuelle consciente, puisque<br />

l’orientation de l’adaptateur est discriminable. En bas, lorsque l’orientation de l’adaptateur n’est<br />

pas discriminable à cause de la présence de voisins similaires, on parle d’adaptation encombrée,<br />

non consciente. En 1996, Sheng He et collaborateurs ont mesuré que l’amplitude de l’adaptation<br />

était indépendante de l’accès conscient à l’orientation de l’adaptateur, et donc indépendante de<br />

l’encombrement. Ce résultat fournissait la première évidence pour le traitement non conscient<br />

d’une information encombrée. (Adapté de He et al., 1996)<br />

tex visuel primaire. Il découle alors que l’orientation encombrée, bien qu’inaccessible<br />

consciemment, est traitée à ce niveau, contrairement à la prédiction faite par la théorie<br />

ascendante. Dans la continuité de ces travaux, Montaser-Kouhsari & Rajimehr (2005) ont<br />

montré le rôle de l’attention dans l’encodage de l’orientation encombrée, l’importance de<br />

l’effet consécutif mesuré étant dépendante de l’attribution des ressources attentionnelles<br />

à la tâche. Par ailleurs, des travaux ont montré que l’orientation non discriminable d’une<br />

cible placée parmi un ensemble de distracteurs eux-mêmes orientés influençait l’estimation<br />

de l’orientation moyenne de l’ensemble du dispositif (Parkes et al., 2001). Il apparaît<br />

alors que même si l’accès conscient aux identités individuelles dans un dispositif encombré<br />

est empêché, ces identités sont néanmoins traitées individuellement jusqu’à des niveaux<br />

assez élevés, et contribuent ainsi à la perception d’une texture globale du dispositif. Le<br />

modèle sous-jacent est celui de l’agglomération (pooling), dans lequel le système moyenne<br />

l’estimation de l’orientation. Ainsi, le modèle stipule que si n éléments présentés à l’écran<br />

sont orientés, et m − n ne le sont pas, l’estimation moyenne est proportionnelle à n, et<br />

le seuil perceptuel décroit proportionnellement à m + n. Selon cette proposition, l’espacement<br />

critique refléterait la région au niveau de laquelle l’agglomération des différentes<br />

orientations est réalisée. Nous reviendrons sur cette notion au cours de la discussion.<br />

Modérant ces principaux résultats, d’autres travaux (Blake et al., 2006) suggèrent cependant<br />

qu’en empêchant la perception consciente de lignes orientées, l’encombrement<br />

49


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

réduit leur influence sur la perception d’orientations similaires subséquentes. En d’autres<br />

termes, l’encombrement réduit l’amplitude de l’effet consécutif à l’orientation, l’illusion<br />

perceptuelle induite par adaptation sensorielle aux lignes orientées. Si l’encombrement<br />

perturbe le traitement de l’orientation au sein du cortex visuel précoce, son inauguration<br />

ne peut donc être faite exclusivement au sein d’aires visuelles de haut niveau. Les auteurs<br />

proposent plutôt que les phénomènes rendant compte de l’inaccessibilité à la conscience<br />

d’une information encombrée sont mixtes, résultant d’une cascade d’événements neuraux<br />

débutant au sein des aires visuelles précoces, et culminant avec la dégradation de l’activité<br />

neurale au sein d’aires cérébrales de plus haut niveau corrélant plus directement avec<br />

la conscience perceptuelle. Puisque son état varie avec des fluctuations de la conscience<br />

perceptuelle, le cortex visuel primaire n’est pas considéré ici comme indépendant des<br />

corrélats neuraux de la conscience (même si l’accès conscient ne concerne pas l’ensemble<br />

des opérations y figurant, voir Crick & Koch, 1995).<br />

Les travaux contenus dans ce manuscrit étendent l’éventail des évidences en faveur des<br />

théories descendantes de l’encombrement, en identifiant des niveaux de traitement de<br />

stimuli encombrés jusqu’alors inconnus, en montrant que ces derniers sont à même d’influencer<br />

la perception mais également les actions ainsi que les jugements de préférence.<br />

Les comparaisons entre perception encombrée et consciente seront discutées dans le chapitre<br />

2 page 188.<br />

2.3 L’encombrement en tant que paradigme expérimental<br />

Une grande partie de ce projet de thèse est fondée sur la mise en place d’un paradigme<br />

expérimental mettant en commun l’encombrement comme phénomène à même de prévenir<br />

l’accès conscient, et la mesure de réponses adaptatives comme signature indirecte du<br />

traitement non conscient associé. Comme indiqué précédemment, l’étude de l’inconscient<br />

cognitif n’a de sens qu’en présence d’un contrôle strict de l’accès conscient au stimulus,<br />

c’est à dire ici sa discriminabilité. En plus des mesures comportementales objectives<br />

et subjectives de visibilité, nous avons implémenté au phénomène d’encombrement un<br />

contrôle basé sur l’oculométrie. Son principe est simple : le participant a pour consigne<br />

de fixer un point à l’écran, alors qu’il est stimulé en périphérie de son champ de vision<br />

par une amorce encombrée. A l’aide d’un oculomètre couplé au dispositif de stimulation,<br />

l’amorce est remplacée par un stimulus non pertinent dès l’instant où le participant<br />

cesse de regarder à l’endroit indiqué (voir figure 2.4 page suivante). Ainsi, la perception<br />

fovéale est proscrite, et l’accès conscient en découlant inexistant. Cette méthode, dite<br />

50


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

d’encombrement contingent à la position du regard (ci-après GCC, pour gaze-contingent<br />

crowding) présente plusieurs avantages pour l’étude de l’inconscient cognitif.<br />

Figure 2.4: Encombrement contingent à la position du regard (GCC). Chaque panneau représente<br />

un écran de stimulation visuelle. Le participant a pour instruction de maintenir le regard sur<br />

la croix de fixation en haut de l’écran (la direction de son regard est symbolisée à gauche de<br />

chaque écran). S’il respecte les consignes, l’amorce encombrée est présentée en bas de l’écran (ici,<br />

un patch de gabor orienté vers la droite, et un visage exprimant la joie, respectivement). Si en<br />

revanche le participant quitte des yeux un carré de 5° de côté entourant la croix, l’amorce est<br />

substituée par un stimulus non pertinent pour la tâche étudiée (ici, un patch de gabor vertical,<br />

et un visage neutre, respectivement).<br />

Durée de stimulation. Tout d’abord, comme la capacité à discriminer un stimulus encombré<br />

est indépendante du temps de présentation (Kooi et al., 1994), et que le GCC<br />

permet de s’assurer que le participant n’accède jamais à l’information de manière fovéale<br />

5 , il est possible de présenter des stimuli encombrés indiscriminables pendant plusieurs<br />

secondes. Cette première propriété dépasse largement ce qui est rendu possible<br />

par le masquage visuel, où un stimulus masqué devient visible s’il est présenté plus de<br />

50ms. Dès lors, il est possible d’étudier le traitement non conscient de stimuli qui ne<br />

font sens que s’ils sont prolongés dans le temps (des vidéos, des séquences, etc.), mais<br />

également d’étudier les conséquences d’une stimulation prolongée sur le traitement non<br />

conscient. La durée de stimulation autorisée par le GCC dépasse également celle permise<br />

5. Pour des données quantitatives sur ce contrôle, voir le chapitre 1 page 57.<br />

51


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

par la rivalité binoculaire, où les stimuli rivaux alternent après quelques secondes de stabilité.<br />

Enfin, elle est du même ordre de grandeur que celle autorisée par le CFS, même<br />

si des durées de plusieurs dizaines de secondes voire de minutes n’ont pas été testées<br />

systématiquement en GCC.<br />

Accès entièrement proscrit. Une seconde particularité du GCC est qu’avec le contrôle<br />

oculomoteur implémenté, les participants n’ont absolument jamais un accès conscient<br />

à l’information présentée. Ce contrôle peut s’avérer utile, notamment pour une étude<br />

utilisant peu de stimuli différents. En effet, le fait d’avoir perçu consciemment au préalable<br />

les stimuli que l’on cherche à étudier peut d’une part induire un effet que l’on attribuerait<br />

à un traitement non conscient mais qui serait en fait un artefact provenant d’influences<br />

conscientes. D’autre part, cela peut augmenter leur visibilité pour les essais suivants, et<br />

donc conduire à écarter le participant de l’analyse. En comparaison, le CFS ne permet<br />

pas de contrôler l’accès à l’information, puisqu’il est possible de fermer l’œil où sont<br />

présentés les mondrians pour avoir accès, ne serait-ce qu’une fois, au stimulus d’intérêt.<br />

Simultanéité des mesures de visibilité et de traitement non conscient. La mesure de<br />

visibilité réalisée avec le GCC se différencie de ce qui est généralement employé en masquage<br />

visuel ou en CFS. Ici, les essais dans lesquels est mesurée la visibilité sont mélangés<br />

aléatoirement aux essais dans lesquels est mesuré le traitement non conscient. Cette<br />

stratégie présente deux principaux avantages. Premièrement, cela force le participant à<br />

porter attention au stimulus périphérique encombré, puisqu’il ne sait jamais par avance<br />

s’il sera confronté à une question le concernant (mesure de visibilité objective directe),<br />

ou plutôt à une cible (mesure d’adaptation sensorielle non consciente). Cette propriété<br />

du dessin expérimental en GCC est à priori moins importante en masquage visuel ou<br />

en CFS, où stimulus masqué et cible apparaissent le plus souvent à la même position<br />

sur l’écran. En revanche, les études nécessitant que le participant ne soit pas informé<br />

de la présence du stimulus encombré ne peuvent pas reposer sur ce dessin expérimental.<br />

Il convient alors de manipuler l’attention portée au stimulus périphérique encombré par<br />

d’autres approches comme l’indiçage ou les charges attentionnelles. Deuxièmement, la<br />

mesure progressive de la discriminabilité au cours de l’expérience permet une estimation<br />

plus fine, où sont pris en compte à la fois les effets d’apprentissage qui augmentent les<br />

performances des participants, et les effets de fatigue qui les diminuent. Dès lors, il est<br />

possible de moduler l’importance de l’encombrement pour se placer au plus proche du<br />

seuil de discriminabilité.<br />

52


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

Manipulation attentionnelle endogène. Puisque l’amorce périphérique encombrée et<br />

la cible apparaissent à différentes positions sur l’écran, il est aisé de manipuler l’attention<br />

endogène portée sur l’amorce. Lorsque le dessin expérimental le permet, il peut être demandé<br />

au participant de négliger, ou au contraire de porter attention à la partie inférieure<br />

de l’écran. La saillance de la partie basse de l’écran peut également être modulée, à l’aide<br />

d’indices attentionnels (Posner, 1980). Ces éléments sont plus difficilement manipulables<br />

en masquage visuel, où la séquentialité très rapide des événements empêche l’inhibition<br />

ou l’amplification volontaire de l’amorce indépendamment de la cible. En CFS, il est<br />

également très difficile de volontairement amplifier une amorce que l’on ne parvient pas<br />

à démarquer de la présence des mondrians, à l’inverse du GCC où le participant détecte<br />

la présence d’éléments encombrés, mais ne parvient pas à les discriminer.<br />

Pertinence écologique. Pour l’étude de l’inconscient cognitif, l’atout principal du GCC<br />

et de l’encombrement en général réside en sa pertinence écologique. Comme souligné par<br />

Whitney et Levi (2011), l’encombrement, omniprésent lors des interactions avec l’environnement,<br />

se traduit par un vaste ensemble de conséquences fixant des limites à la<br />

perception d’objets périphériques pendant la recherche visuelle, mais aussi la lecture ou<br />

la conduite, ainsi que des limites motrices pour le mouvement des yeux et des mains pour<br />

les recherches visuelles et haptiques (Bulakowski et al., 2009). Sans négliger les limites<br />

rétiniennes et rétinotopiques inhérentes au traitement visuel périphérique, les deux autres<br />

techniques que sont le masquage visuel et le CFS, toutes deux restreintes au laboratoire,<br />

semblent présenter des limites plus rigides en comparaison à l’encombrement. Rappelons<br />

que le masquage impose l’usage de stimuli extrêmement brefs de taille réduite, alors que<br />

le CFS requiert une stimulation monoculaire tandis que l’autre œil est bombardé avec<br />

des flashs.<br />

L’organisation asymétrique des aires visuelles centrales et périphériques est une propriété<br />

générale retrouvée chez les mammifères, ce qui laisse présager d’un mécanisme adaptatif<br />

à valeur positive dans la sélection naturelle (Kaskan et al., 2005). Comme vu précédemment,<br />

l’encodage de ces détails en tant que texture peut potentiellement favoriser la<br />

reconnaissance globale d’objets, et déclencher une saccade en sa direction pour un traitement<br />

fovéal plus complet, ou même un autre programme moteur en cas d’évitement<br />

du danger. Le flux d’information visuelle étant volumineux, on évite alors une surcharge<br />

du système central opérationnalisé dans le modèle de l’espace de travail global comme<br />

étant lent et sériel. En lien avec les théories descendantes de l’encombrement, le GCC<br />

pourrait alors se rapprocher des manipulations attentionnelles de l’accès conscient, et<br />

53


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

notamment la modalité de cécité inattentionnelle, elle aussi omniprésente et écologique.<br />

En comparaison avec la cécité inattentionnelle reposant sur la mesure en essai unique<br />

(Mack et Rock, 1998), le GCC permet l’obtention de nombreux points de données sur<br />

un grand nombre d’essais, et donc l’observation précise des phénomènes étudiés.<br />

Plutôt qu’un goulot d’étranglement, l’encombrement peut alors être vu comme un filtre<br />

semi-perméable, à travers duquel seuls certains éléments saillants de la scène accèdent<br />

à la conscience, tandis que d’autres demeurent l’objet d’un traitement non conscient<br />

avant qu’une éventuelle saccade soit déclenchée. Son rôle pourrait alors être de simplifier<br />

l’apparence de stimuli périphériques en favorisant la constance sous forme de texture<br />

(Greenwood et al., 2010). Un autre phénomène intéressant est notre cécité à l’encombrement.<br />

Notre performance visuelle consciente est non seulement faible en périphérie, mais<br />

nous semblons en plus ignorer cette imperfection, sans doute à cause de la potentialité<br />

que l’on a de déclencher une saccade si besoin. Nous reviendrons sur ces notions au cours<br />

de la discussion.<br />

2.4 Plan des études expérimentales<br />

Notre travail a donné lieu à quatre études comportementales, ainsi qu’une étude en<br />

imagerie fonctionnelle. Une seconde étude en imagerie fonctionnelle en cours d’analyse est<br />

également présentée en annexe page 204. Toutes concernent directement la caractérisation<br />

cognitive ou neurale du traitement non conscient de stimuli visuels encombrés. L’ordre<br />

de présentation des études respecte l’ordre chronologique selon lequel nous les avons<br />

conçues et réalisées pendant ces trois années. Nous affinerons donc au cours du plan à<br />

la fois les questions soulevées, mais aussi les méthodes et les analyses pour y répondre.<br />

Chaque étude est brièvement présentée, et suivie de l’article accepté pour publication ou<br />

en révision dont elle a fait l’objet.<br />

Dans le chapitre 1, nous détaillons le GCC, et mettons en évidence par la méthode d’amorçage<br />

de répétition la trace d’un traitement non conscient d’objets complexes encombrés<br />

(visages et symboles directionnels), ainsi que le rôle de l’amplification attentionnelle dans<br />

ce traitement (Faivre & Kouider, 2011).<br />

Les trois études suivantes abordent une problématique commune, à savoir le traitement<br />

émotionnel non conscient, et son influence de haut niveau sur les comportements subséquents.<br />

Dans le chapitre 2 qui concerne le traitement non conscient d’expressions faciales<br />

54


CHAPITRE 2.<br />

L’ENCOMBREMENT COMME SONDE DE L’INCONSCIENT COGNITIF<br />

encombrées, nous étendons nos premiers résultats selon deux axes. Premièrement, les<br />

opérations visuelles mises en évidence sont plus complexes que dans l’étude précédente,<br />

puisque sensibles à l’inversion de visages à la fois statiques (images) et dynamiques (vidéos).<br />

Cela suggère l’existence d’un traitement holistique, ou configural des visages encombrés<br />

en l’absence d’accès conscient. Deuxièmement, le produit de ce traitement biaise<br />

non plus la perception subséquente de stimuli identiques comme c’est le cas dans l’amorçage<br />

de répétition, mais des processus de plus hauts niveaux impliqués dans les jugements<br />

de préférence (Kouider, Berthet, et Faivre, 2011). La troisième étude présentée dans le<br />

chapitre 3 consiste en une comparaison systématique de différentes méthodes (GCC,<br />

masquage visuel, CFS) utilisées pour l’étude du biais de préférence non conscient. Elle<br />

révèle les étendues et limites de chacune d’entre-elles, en rappelant la nécessité des comparaisons<br />

méthodologiques pour l’étude contrastive de la conscience. La quatrième étude<br />

présentée dans le chapitre 4 analyse par IRMf les bases neurales du biais de préférence<br />

non conscient induit par des expressions faciales encombrées. Elle révèle des voies de<br />

traitement distinctes selon qu’elles soient de nature statique ou dynamique.<br />

Enfin, au sein d’une problématique différente, la cinquième étude présentée dans le chapitre<br />

5 tire profit du GCC pour isoler les influences respectives de la durée de stimulation<br />

et de l’accès conscient pendant l’adaptation sensorielle. Avec une tâche d’amorçage de<br />

la discrimination d’orientation, cette étude montre un pattern d’adaptation sensorielle<br />

non consciente biphasique, dans lequel l’amorce encombrée a un rôle d’abord facilitateur,<br />

puis inhibiteur en cas de présentation trop prolongée. En accord avec plusieurs théories<br />

de la conscience et de l’attention, la restauration de l’accès conscient par diminution de<br />

l’encombrement induit une amplification des effets facilitateurs, ainsi qu’une diminution<br />

des effets inhibiteurs.<br />

Nous discuterons des leçons tirées de ces études selon deux grands axes. D’abord, nous<br />

synthétiserons les évidences montrant l’apport de l’étude du traitement non conscient<br />

sur le phénomène d’encombrement. Nous argumenterons en faveur d’origines tardives et<br />

multiples au sein des voies visuelles, et du rôle de l’amplification attentionnelle pour l’extraction<br />

d’information encombrée. Ensuite, nous synthétiserons les évidences montrant<br />

l’apport du phénomène d’encombrement comme outil pour mieux caractériser l’inconscient<br />

cognitif, et comme corrélat de l’hypothèse de conscience partielle. Enfin, dans le<br />

cadre d’une approche contrastive, nous suggérerons que l’encombrement consiste en une<br />

modalité perceptuelle intéressante pour comparer les propriétés intégratives spatiales et<br />

temporelles en présence et en absence d’accès conscient.<br />

55


Deuxième partie<br />

Études expérimentales


1 Amorçage non conscient issu d’objets<br />

encombrés<br />

1.1 Présentation de l’étude<br />

Faivre, N., & Kouider, S. (2011). Multi-feature objects elicit nonconscious<br />

priming despite crowding. Journal of Vision, 11(3) :2, 1–10.<br />

Introduction<br />

Comme nous l’avons introduit dans la sous-section 2.2.2 page 47, la dissociation entre le<br />

percept d’une information encombrée et son traitement non conscient est appuyée par<br />

plusieurs études. En résumé, les mesures psychophysiques montrent que le système visuel<br />

présente des propriétés adaptatives en réponse à des stimuli encombrés orientés (He et al.,<br />

1996; Montaser-Kouhsari & Rajimehr, 2005). On peut alors inférer que l’information<br />

d’orientation angulaire, dont le traitement démarre au niveau du cortex visuel primaire,<br />

résiste à l’encombrement. Qu’en est-t-il pour les informations de plus haut niveau ?<br />

A l’aide de la méthode d’encombrement contingent à la position du regard (GCC) couplée<br />

au paradigme d’amorçage de répétition, nous avons testé l’existence d’un traitement<br />

non conscient d’objets encombrés. Ici, par objet on entend un stimulus composé d’un<br />

agencement de plusieurs caractéristiques physiques, ou traits. Deux types de stimuli ont<br />

été utilisés. D’une part, des visages célèbres et non célèbres (expérience 1), dont le traitement<br />

à la fois conscient et non conscient est bien décrit (Henson et al., 2008; Kouider<br />

et al., 2009). D’autre part, des chevrons directionnels (expérience 2), composés de l’agencement<br />

de deux traits orientés (> ou


CHAPITRE 1.<br />

AMORÇAGE NON CONSCIENT ISSU D’OBJETS ENCOMBRÉS<br />

cas de figures étaient possibles. Dans les essais dits d’amorçage, une cible apparaissait<br />

en haut de l’écran, l’instruction était alors d’indiquer le plus rapidement possible dans<br />

l’expérience 1 si le visage était celui d’une personne connue ou inconnue, ou dans l’expérience<br />

2 si le chevron pointait vers la droite ou vers la gauche. A noter que chacune des<br />

expériences comportait des amorces et cibles apparaissant à des localisations différentes,<br />

et testait donc un encodage indépendant de la rétinotopie. Comme c’est le cas pour les<br />

expériences d’amorçage de répétition, nous avons alors comparé les temps de réaction sur<br />

les cibles, quand ces dernières étaient précédées d’une amorce identique (visage identique,<br />

chevron de même direction), et d’une amorce différente (visage différent appartenant à<br />

la même catégorie de célébrité, chevron de direction opposée). Dans les essais dits de mesure<br />

objective de visibilité, l’instruction dans l’expérience 1 était d’indiquer parmi deux<br />

alternatives présentées à l’écran laquelle représentait le visage présenté en amorce, ou de<br />

répondre dans l’expérience 2 à une question concernant l’orientation du chevron.<br />

Par ailleurs, l’expérience 2 incluait une manipulation de charge attentionnelle et se déclinait<br />

ainsi en deux versions. Dans l’expérience 2a, la cible apparaissait en remplacement<br />

d’une simple croix de fixation, ce qui la rendait aisément discriminable, et ce qui préservait<br />

donc des ressources nécessaires à l’amplification attentionnelle couverte de l’amorce<br />

en bas de l’écran. Dans l’expérience 2b, la même cible apparaissait au sein d’une séquence<br />

de symboles complexes, ce qui la rendait plus difficile à discriminer, et réduisait ainsi les<br />

ressources attentionnelles portées à l’amorce en bas de l’écran. Cette manipulation de<br />

charge attentionnelle a donc permis de tester le rôle de l’amplification attentionnelle<br />

dans le traitement non conscient d’objets encombrés.<br />

Principaux résultats<br />

Tout d’abord, les résultats de cette première étude valident le GCC en tant que méthode<br />

pour prévenir l’accès conscient à des stimuli périphériques encombrés. Nous avons<br />

en premier lieu conclu que la substitution par oculométrie était nécessaire, puisque les<br />

participants tentaient d’accéder à l’amorce de manière fovéale en dépit des consignes.<br />

Nous avons également confirmé que l’encombrement était bien à l’origine de l’incapacité<br />

à discriminer l’amorce, en révélant la restauration progressive de la discriminabilité par<br />

l’augmentation de l’espacement entre amorce et voisins. Enfin, nous avons contrôlé l’efficacité<br />

de la substitution de l’amorce en cas de tentative d’accès fovéal, en montrant<br />

l’absence de corrélation entre la durée de ces tentatives et la discriminabilité. Toutes les<br />

expériences ont révélé une mesure de d’ non significativement différente de zéro, témoignant<br />

d’une discriminabilité nulle.<br />

58


CHAPITRE 1.<br />

AMORÇAGE NON CONSCIENT ISSU D’OBJETS ENCOMBRÉS<br />

En ce qui concerne les mesures indirectes de traitement non conscient, l’analyse des temps<br />

de réaction dans l’expérience 1 a révélé un effet d’amorçage induit uniquement par les<br />

visages connus. Dans l’expérience 2, la même analyse a révélé un effet d’amorçage, réduit<br />

en présence d’une charge attentionnelle.<br />

Discussion<br />

Ces premiers résultats montrent la légitimité du GCC pour étudier le traitement non<br />

conscient d’information encombrée de haut niveau. Ils révèlent la capacité d’intégrer correctement<br />

plusieurs traits encombrés en une représentation non consciente unifiée (par<br />

exemple, le liage de deux barres d’orientations opposées en un chevron directionnel) qui<br />

par la suite peut influencer la perception d’une cible sans similarité rétinotopique. Cela<br />

questionne par conséquent le modèle en deux étapes de l’encombrement qui lie son origine<br />

à un excès d’intégration au sein de régions communes à l’amorce et ses voisins. Plutôt<br />

qu’un excès d’intégration proprement dit, nos résultats suggèrent que les différents traits<br />

de l’amorce sont d’abord correctement intégrés puis traités de manière non consciente<br />

(rendant compte ainsi des effets que nous avons observés), avant d’être accédés consciemment<br />

sous forme de texture dans laquelle la discrimination est impossible. Il s’agit donc<br />

d’une situation de conscience partielle de l’information, sous tendant un traitement d’une<br />

partie de l’information demeurant inaccessible à la conscience. L’effet de la charge attentionnelle<br />

sur l’amorçage d’action lie cette hypothèse aux théories descendantes de<br />

l’encombrement. En demeurant agnostique vis à vis de l’influence de l’attention sur la<br />

taille des fenêtres d’intégration, on peut néanmoins postuler que l’amplification attentionnelle,<br />

sans induire la discriminabilité consciente du stimulus encombré, augmente la<br />

force de son signal tout en inhibant celle de ses voisins, et maximise ainsi l’influence des<br />

représentations non conscientes associées.<br />

1.2 Article<br />

59


Journal of Vision (2011) 11(3):2, 1–10 http://www.journalofvision.org/content/11/3/2 1<br />

Multi-feature objects elicit nonconscious priming<br />

despite crowding<br />

Nathan Faivre<br />

Sid Kouider<br />

Laboratoire de Sciences Cognitives et Psycholinguistique,<br />

CNRS/EHESS/DEC-ENS, Paris, France<br />

Laboratoire de Sciences Cognitives et Psycholinguistique,<br />

CNRS/EHESS/DEC-ENS, Paris, France<br />

The conscious representation we build from the visual environment appears jumbled in the periphery, reflecting a<br />

phenomenon known as crowding. Yet, it remains possible that object-level representations (i.e., resulting from the binding of<br />

the stimulus’ different features) are preserved even if they are not consciously accessible. With a paradigm involving gazecontingent<br />

substitution, which allows us to ensure the constant absence of peripheral stimulus discrimination, we show that,<br />

despite their jumbled appearance, multi-feature crowded objects, such as faces and directional symbols, are encoded in a<br />

nonconscious manner and can influence subsequent behavior. Furthermore, we show that the encoding of complex<br />

crowded contents is modulated by attention in the absence of consciousness. <strong>These</strong> results, in addition to bringing new<br />

insights concerning the fate of crowded information, illustrate the potential of the Gaze-Contingent Crowding (GCC)<br />

approach for probing nonconscious cognition.<br />

Keywords: crowding, face processing, action priming, nonconscious cognition<br />

Citation: Faivre, N., & Kouider, S. (2011). Multi-feature objects elicit nonconscious priming despite crowding.<br />

Journal of Vision, 11(3):2, 1–10, http://www.journalofvision.org/content/11/3/2, doi:10.1167/11.3.2.<br />

Introduction<br />

When we are immersed in a complex environment,<br />

objects in the periphery appear jumbled and become<br />

hardly discriminable. This phenomenon, known as crowding,<br />

is a breakdown in the process leading to the<br />

identification of peripheral objects when they are surrounded<br />

by similar neighbors (Levi, 2008). As opposed to<br />

visual masking, in which even detection can be abolished,<br />

crowding reflects a situation where a stimulus can be<br />

detected but not discriminated (Pelli, Palomares, & Majaj,<br />

2004). Due to the correct detection capabilities, it is<br />

commonly accepted that crowding occurs after featural<br />

detection, arguably during the integration of the features<br />

into one unified object (e.g., the integration of different<br />

elementary shapes forming a more complex pictograph).<br />

However, there is no general consensus regarding the<br />

specific mechanisms underlying crowding, and theories<br />

largely diverge on the origins of this phenomenon.<br />

According to neuronal, or bottom-up accounts, crowding<br />

occurs when both the object and its neighbors overlap<br />

within the same receptive field, which is also called<br />

integration field (Pelli, 2008). In peripheral vision, as the<br />

size of the integration fields widens with eccentricity, the<br />

probability with which several features from different<br />

adjacent stimuli are integrated into the same field becomes<br />

higher, correlating with the eccentricity dependence of<br />

crowding (Bouma, 1970). This correlation is alternatively<br />

explained by higher level or top-down accounts of<br />

crowding in which the overlap is not attributed to hardwired<br />

limitations in the visual cortex but rather to a<br />

coarsening of the resolution of spatial attention in the<br />

periphery (Intriligator & Cavanagh, 2001). Along this<br />

line, recent physiological evidence shows that crowded<br />

perception is associated with a spread spatial distribution<br />

of attention around the target stimulus and its neighbors<br />

(Fang & He, 2008). The attentional account is also<br />

supported by crowding asymmetry (i.e., crowding is<br />

stronger in the upper than in the lower visual field, as<br />

demonstrated with several attentional effects; see He,<br />

Cavanagh, & Intriligator, 1996). It is also supported by<br />

crowding temporal resolution (i.e., around 6–8 Hz, similar<br />

to that of attention; see Chakravarthi & Cavanagh, 2007)<br />

and by the attentional dependence of the encoding of<br />

crowded contents (Montaser-Kouhsari & Rajimehr, 2005).<br />

Other accounts, noting that spatial uncertainty is high in<br />

the periphery (Pelli, 1985), assert that the jumbled aspect<br />

of crowded objects arises from a loss of position<br />

information. This lack could potentially induce the<br />

integration of mislocalized features from different stimuli<br />

into the same object (Popple & Levi, 2005). <strong>These</strong><br />

different operationalizations of crowding are not mutually<br />

exclusive, as illustrated by a recent computational<br />

approach relying on classification image techniques (i.e.,<br />

without preassumptions regarding the origin of crowding).<br />

This computational account, in fact, supports both inappropriate<br />

feature integration and feature mislocalization as<br />

contributors to crowding (Nandy & Tjan, 2007). Finally,<br />

supported by both empirical data and computational<br />

doi: 10.1167/11.3.2 Received September 30, 2010; published March 3, 2011 ISSN 1534-7362 * ARVO


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 2<br />

models, some accounts state that the information available<br />

during crowding is textural and consists of summary<br />

statistics that comprise distributions of feature values<br />

rather than of localized feature maps (Balas, Nakano, &<br />

Rosenholtz, 2009; Parkes, Lund, Angelucci, Solomon, &<br />

Morgan, 2001).<br />

Here, we studied the nonconscious processing of<br />

crowded multi-feature stimuli, defined as the processing<br />

of their informational content in the absence of a<br />

corresponding conscious experience. Despite the subjective<br />

feeling of uninformative contents, previous findings<br />

show that low-level information such as tilt orientation is<br />

properly encoded even when crowded by adjacent vertical<br />

flankers (He et al., 1996). This study used visual<br />

adaptation as an index of nonconscious orientation<br />

processing, a situation in which the perceptual threshold<br />

of a target is increased when preceded by a crowded<br />

adaptor sharing the same orientation.<br />

The present study tested whether nonconscious processing<br />

of crowded stimuli extends beyond single feature<br />

information (e.g., line orientations) to higher levels of<br />

processing involved in processes such as face recognition<br />

and directional symbol processing. For this purpose, we<br />

combined crowding, in order to impede the discrimination<br />

of a multi-feature stimulus, with a priming paradigm in<br />

order to measure its influences on behavior. Nonconscious<br />

priming occurs when the processing of a highly visible<br />

target is facilitated by a preceding related prime stimulus,<br />

which is maintained under the threshold of consciousness<br />

by techniques such as visual masking (Kouider &<br />

Dehaene, 2007). By manipulating the prime–target relation,<br />

one can investigate which levels of processing<br />

influence behavior (e.g., priming for semantic associates<br />

such as “nurse–doctor” implies nonconscious processing<br />

of the meaning of the prime). In order to control for prime<br />

discriminability, we use a method termed gaze-contingent<br />

crowding (GCC). This technique ensures perception<br />

without discrimination of long-lasting peripheral objects<br />

through high-resolution eye tracking. Specifically, it<br />

allows for the relevant crowded prime to be substituted<br />

by noninformative content as soon as the participant<br />

attempts to move their gaze from a fixation position, thus<br />

preventing foveal access to the prime stimulus.<br />

In a first experiment, we studied the influence of<br />

peripheral faces subject to crowding (rendered nondiscriminable<br />

by GCC) on a fame categorization task. In a<br />

second experiment, we studied the influences of crowded<br />

symbols (pointing arrows). In addition, we assessed the<br />

role played by spatial attention on the encoding of<br />

crowded stimuli. We found that both types of information<br />

can prime behaviors in a nonconscious manner, revealing<br />

that the dissociation between perceptual consciousness<br />

(jumbled, uninformative) and perceptual processing (distinct,<br />

informative) extends to higher level objects such as<br />

faces and symbols. In addition, we observed that the<br />

impact of crowded information on sensorimotor pathways<br />

is modulated by the allocation of spatial attention. <strong>These</strong><br />

results and their implications are discussed in the light of<br />

both the partial awareness framework (Kouider, de Gardelle,<br />

Sackur, & Dupoux, 2010) and top-down accounts of the<br />

crowding phenomenon.<br />

Experiment 1<br />

The mechanisms underlying nonconscious face perception<br />

are now well documented, both at behavioral and<br />

neural levels. Recent evidences have shown that subliminal<br />

and supraliminal faces are processed differently<br />

depending on their frequency spectrum (de Gardelle &<br />

Kouider, 2010), while they elicit neural activity in<br />

common cortical areas (e.g., in the fusiform face area;<br />

see Kouider, Eger, Dolan, & Henson, 2009). Yet, as this<br />

issue has been mainly addressed through visual masking,<br />

little is known about the nonconscious processing of faces<br />

during crowding. For this purpose, we adapted a face<br />

repetition priming paradigm to GCC (see Figure 1a). Face<br />

crowding can occur both between features within a face<br />

(i.e., featural or self-crowding; see Martelli, Majaj, &<br />

Pelli, 2005) and between the configurational representation<br />

of different adjacent faces (i.e., holistic or configurational<br />

crowding; see Farzin, Rivera, & Whitney, 2009;<br />

Louie, Bressler, & Whitney, 2007). We established the<br />

encoding quality of peripheral faces subject to self-crowding<br />

by measuring their ability to elicit repetition priming effects<br />

in a fame categorization task while remaining nondiscriminable,<br />

as demonstrated by a 2-alternative forced-choice<br />

measure of consciousness.<br />

Methods<br />

Subjects<br />

Eighteen university students (age range = 18–35)<br />

participated in Experiment 1. All participants were<br />

recruited in function of their media exposure (to ensure<br />

that famous faces were familiar to them), reported normal<br />

or corrected vision, and were paid for their participation.<br />

Stimuli<br />

Target stimuli were 3- 3.5- grayscale photographs of<br />

40 famous and 40 unknown faces selected from a<br />

previously used set (de Gardelle & Kouider, 2010). Half<br />

were male; half were female. All pictures were matched<br />

for image size and luminance and cropped to show only<br />

the face. Distractors were 40 different 3- 3.5- meaningless<br />

patterns created by blending 6 randomly chosen<br />

images from 3 different categories (2 nonfamous faces<br />

from a different stimulus set, 2 watches, 2 flowers). The


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 3<br />

Figure 1. (a) Face priming paradigm. Each trial started with the presentation of a fixation cross, followed by a mask presented at fixation<br />

location and a peripheral preprime mask presented at the bottom. This was followed by a stream of alternating masks at fixation position<br />

until the target display, while a prime face appeared downward. The target appeared on the top of the screen after an unpredictable time<br />

and consisted either of a face on which participants judged whether it belonged to a famous or unknown person (priming trials), or in a<br />

question mark between two faces, among which participants had to choose the prime face (prime discrimination trials). Priming trials were<br />

“related” when the prime and the target were identical faces and “unrelated” when they were different faces belonging to the same<br />

category (both famous or both nonfamous). Priming trials ended with a final display of post-target masks, while prime discrimination trials<br />

ended with the participant’s response. (b) Famous face priming results. Averaged reaction times on the fame categorization task for<br />

famous faces in related (black) and unrelated (gray) trials. Error bars denote one standard error; *p-value G 0.05.<br />

average luminance, contrast, and shape of the distractors<br />

were set to be similar to those of the faces.<br />

Procedure and design<br />

Eccentricity between prime and target was 15-, with<br />

target location centered at the quarter top of the screen<br />

and prime location at the bottom. Each trial started with<br />

the appearance of a fixation cross for 300 ms and a<br />

6- diameter red circle at the target location, which<br />

remained on the screen until the end of a trial. Following<br />

the fixation cross, two different distractors appeared<br />

simultaneously for 200 ms, one at target location and the<br />

other at prime location (preprime mask). Then, subjects<br />

were presented with either 1, 3, 5, or 7 distractors, each<br />

for 200 ms at the target location, while the primes<br />

appeared at the bottom of the screen for the same duration<br />

(e.g., 200 ms, 600 ms, 1000 ms, or 1400 ms). <strong>These</strong> events<br />

were immediately followed by the target face while<br />

another distractor replaced the prime, both for 200 ms.<br />

Finally, the target was followed by 7, 5, 3, or 1 post-target<br />

mask(s), in inverse proportion to the preceding distractors.<br />

Participants were instructed to keep track of the target<br />

location until the target face appeared. Importantly, as<br />

soon as a participant ceased to gaze at a 5- by 5- area<br />

surrounding the target location, the prime was substituted<br />

by a pattern during the next refresh cycle of the monitor<br />

screen, guaranteeing that the prime was never accessed<br />

foveally.<br />

Participants’ main task was to decide, as fast as<br />

possible, whether each target face belonged to famous or<br />

unknown person, with their right or left index finger,<br />

respectively. Within a trial, the prime and the target could<br />

either be the same faces (repetition trials) or different<br />

faces (unrelated trials). In the latter case, the two prime–<br />

target counterparts always belonged to the same category<br />

(as well as to the same gender and same approximate age),<br />

assuring that the unrelated and related conditions referred<br />

to the same motor response. This was designed in order to<br />

avoid confounding response congruency with perceptual<br />

priming (Abrams, Klinger, & Greenwald, 2002; Damian,<br />

2001; Kouider & Dehaene, 2009). In addition to the main


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 4<br />

task, a prime discrimination task was randomly administrated<br />

to the participants in 1 out of 5 trials. In this case,<br />

a question mark appeared instead of the target, simultaneously<br />

with the two alternatives (i.e., the prime and its<br />

counterpart) appearing at 7.5- on the left or 7.5- on the<br />

right side of the screen. While the two alternatives were<br />

accessible foveally, the participant’s task was to decide in<br />

a two-alternative forced-choice task (2-afc) whether the<br />

left or right face corresponded to the prime, by pressing<br />

the corresponding left or right button. This control was<br />

preferred to applying the same fame decision task to the<br />

primes, because it allows ruling out eventual situations<br />

where participants have a partial consciousness (i.e.,<br />

access to some of the featural information), which would<br />

be insufficient to extract the fame of the prime face but<br />

which is sufficient to speed up the processing of the<br />

subsequent identical target face (see Kouider, Dehaene,<br />

Jobert, & Le Bihan, 2007; Kouider & Dupoux, 2004).<br />

Participants received a total of 80 prime discrimination<br />

trials randomly intermixed with 320 priming trials.<br />

Stimuli were displayed against a black background by a<br />

22-in. Iiyama Vision master pro 510 monitor (frame rate of<br />

85 Hz, resolution of 1024 768 pixels) on a computer<br />

running Matlab with the Psychophysics Toolbox (Brainard,<br />

1997; Pelli, 1997). The participant sat 57 cm from the<br />

screen in a dimly lit room. A chin rest and a headrest were<br />

used. Eye movements were recorded monocularly with<br />

a video-based tower mounted eye tracker (Eyelink<br />

1000 System, SR Research, Ontario, Canada) controlled<br />

with the Eyelink Toolbox (sampling rate 1000 Hz; spatial<br />

resolution 1- or above).<br />

face, which might be less subject to crowding) could drive<br />

the priming effect. However, faces were cropped such as<br />

the more eccentric discriminatory facial features, like the<br />

ears, were not presented. Crucially, if any other uncontrolled<br />

peripheral features (which are only poorly discriminatory)<br />

were at the origin of the priming effect, these very<br />

same features would have led participants to discriminate<br />

above chance between the two faces during the prime<br />

discrimination trials. Debriefing the participants after the<br />

experiment revealed, however, that none of them could<br />

identify the prime faces even when they were told about<br />

their presence. A 2-afc on the prime confirmed that our<br />

method rendered the stimuli nondiscriminable, as performance<br />

was at chance for both famous (mean dV= 0.07;<br />

SD = 0.47; p = 0.54) and nonfamous faces (mean dV =<br />

j0.22; SD = 0.77; p = 0.25). In sum, Experiment 1<br />

revealed that stimulus information is maintained even for<br />

peripheral faces subject to self-crowding and that this<br />

information facilitates foveal face recognition.<br />

Experiment 2<br />

Nonconscious symbolic action priming reflects the<br />

facilitation of a motor response on a directional target<br />

stimulus, when it is preceded by the same directional<br />

Results and discussion<br />

Trials in which the gaze position was maintained<br />

outside the target area for more than 50 ms were rejected<br />

(see Methods section), leading to a removal of 8.7%<br />

(SD = 7.8) of the total trials. Famous target faces were<br />

correctly recognized with a rate of 84.7% (SD = 10.8), and<br />

nonfamous faces were categorized as nonfamous with a<br />

rate of 82.8% (SD = 12.8). Only correct responses were<br />

included in the analyses. We performed an ANOVA on<br />

reaction time, with participants as a random variable and<br />

relation and prime duration as main factors. Because<br />

masked repetition priming for unknown faces is usually<br />

nonsignificant unless faces are visible, we analyzed<br />

famous and unknown faces separately (see de Gardelle<br />

& Kouider, 2010; Henson, Mouchlianitis, Matthews, &<br />

Kouider, 2008; Kouider et al., 2009). Here, with crowded<br />

faces, we found significant priming for famous faces<br />

[19 ms; F(1,17) = 5.79; p G 0.05] but not for unknown<br />

faces (F G 1; see Figure 1b). Further analyses restricted to<br />

famous faces revealed neither effect of prime duration nor<br />

an interaction between priming and prime duration (Fs G 1).<br />

One could argue that some residual information whose<br />

access is not impeded by crowding (e.g., in the edge of the<br />

Figure 2. Averaged fixation positions during Experiment 2<br />

(collapsed across 2A and 2B). Each dot stands for a gaze<br />

position measured at 1000 Hz. Green dots correspond to target<br />

position fixation (compliantly to the instructions). Red dots<br />

represent attempts to stare at the peripheral prime, despite the<br />

instructions, homogeneously spread across a session. Participants<br />

tried to look at the prime while it was displayed on 9.3%<br />

(SD = 13.2) of the trials, representing 0.5% (SD = 0.7) of total<br />

looking time.


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 5<br />

Figure 3. (a) Action priming paradigm. Each trial started with the presentation of a fixation cross. At the bottom of the screen, this was<br />

followed by the apparition of four flanker crosses surrounding first a central cross (preprime mask) and then the prime arrow for variable<br />

durations. Afterward, the target appeared at the top of the screen among a sequence of geometrical distractors. The target was either an<br />

arrow on which participants had to indicate its orientation (priming trials) or a question about the orientation to which participants were<br />

forced to answer (yes or no) before continuing (prime discrimination trials). Priming trials ended with a final display of post-target masks,<br />

while prime discrimination trials ended with the participant’s response. This figure illustrates the high attentional load condition. In the low<br />

attentional load condition, the exact same procedure was used, except that instead of the sequence of geometrical distractors, a fixation<br />

cross was presented for the duration of each trial. (b) Action priming results. Averaged reaction times on the target orientation task for low<br />

attentional load and high attentional load conditions, in related (black) and unrelated (gray) trials. Error bars denote one standard error;<br />

*p-value G 0.05, ***p-value G 0.001.<br />

prime presented below the threshold of consciousness (e.g.,<br />

Vorberg, Mattler, Heinecke, Schmidt, & Schwarzbach,<br />

2003). So far, these nonconscious sensorimotor effects<br />

have only been established using visual masking and it<br />

remains unclear whether they can be induced by crowded<br />

stimuli. Here, we measured the action priming effects<br />

induced by crowded chevron arrows (i.e., G or 9, see<br />

Figure 2a), while manipulating the allocation of spatial<br />

attention devoted to the encoding of crowded stimuli. This<br />

latter aspect allowed us to test whether attention plays a<br />

role in crowded perception, as postulated by top-down<br />

accounts (Figure 3).<br />

Methods<br />

Subjects<br />

A new group of 39 university students (age range =<br />

18–35) participated in Experiment 2, separated into two<br />

subgroups for Experiments 2A (N = 19) and 2B (N = 20).<br />

All subjects reported normal or corrected vision and were<br />

paid for their participation.<br />

Stimuli<br />

Arrow stimuli were 1.2- 1.2- chevrons. Flankers were<br />

four 1.2- 1.2- + signs. Distractors were 5 types of<br />

1.2- 1.2- geometrical forms (+, =, , ||, #). All stimuli<br />

were presented in gray against a black background.<br />

Procedure and design<br />

A similar procedure and design to Experiment 1 was<br />

used in Experiments 2A and 2B, except with the following<br />

main aspects: (a) Target arrows were either identical or<br />

opposite to the prime arrows. (b) The prime arrows were<br />

now surrounded by flankers with a center-to-center<br />

spacing of 1.4-. During the prime discrimination task,<br />

subjects received the words “left?” or “right?” and were


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 6<br />

asked to indicate whether or not this indicated the prime<br />

direction (yes with right index finger, no with left index<br />

finger). The critical difference between Experiments 2A<br />

and 2B was the presence of either a constant and single +<br />

sign at the target location in Experiment 2A (low attentional<br />

load) or a stream of nine alternating distractors<br />

chosen randomly (while excluding contiguous presentations)<br />

in Experiment 2B (high attentional load). As in<br />

Experiment 1, as soon as participants’ gaze diverged from<br />

a5- by 5- area surrounding the target location, the prime<br />

was substituted by a + sign in order to prevent foveal<br />

access of the prime (see Figure 2).<br />

Results and discussion<br />

As in Experiment 1, only trials for which gaze position<br />

was outside the target area less than 50 ms were conserved<br />

for analysis. This corresponded to the removal of 4.6% of<br />

total trials (SD = 6.9) in Experiment 2A and 10.6% (SD =<br />

8.1) in Experiment 2B. Only correct responses were<br />

analyzed, corresponding to a removal of 6.6% of<br />

responses (SD = 6.5) in Experiment 2A and 4.9% of<br />

responses (SD = 5.0) in Experiment 2B. An ANOVA on<br />

reaction time was performed, with participants as a<br />

random variable and relation, attentional load, and prime<br />

duration as main factors. We found a main effect of<br />

relation showing that participants were faster for<br />

congruent compared to incongruent trials [7 ms; F(1,37) =<br />

19.48; p G 0.0001]. Crucially, we also found an interaction<br />

between relation and perceptual load [F(1,37) = 5.38; p G<br />

0.03], reflecting the fact that the magnitude of priming<br />

was larger under low attentional load [11.5 ms; t(18) =<br />

3.8; p G 0.001] compared to high attentional load<br />

condition [4 ms; t(19) = 2.25; p G 0.05] (see Figure 2b).<br />

Although there was a main effect of prime duration<br />

[F(1,37) = 20.95; p G 0.0001] reflecting averaged reaction<br />

times decreasing with prime duration, this factor did not<br />

interact with relation (F G 1). This latter aspect suggests<br />

that, as for Experiment 1, the magnitude of priming was<br />

not affected by the amount of sensory evidence in the<br />

prime stimulus. With regard to prime consciousness, while<br />

participants were informed that oriented arrows were<br />

presented in their peripheral visual field, none of them<br />

declared being able to discern their orientations during the<br />

post-experiment debriefing. The objective prime discrimination<br />

measure interleaved within the priming measure<br />

confirmed this subjective report by revealing chance-level<br />

performance under both low (mean dV= 0.17; SD = 0.62;<br />

p = 0.24) and high attention load conditions (mean dV=<br />

j0.01; SD = 0.57; p = 0.95). In addition, there was no<br />

significant difference in prime discrimination as a function<br />

of attentional load (p = 0.35). Finally, we verified that<br />

crowding was the limiting factor impeding prime discrimination<br />

by conducting an additional control experiment<br />

with five new participants. While they were exposed to the<br />

same display as in Experiment 2B (i.e., with prime<br />

Figure 4. Visibility as a function of center-to-center spacing of the prime and flankers. Each symbol is the average of prime discrimination as<br />

computed by a measure of d-prime for one participant. The thick line represents the prime discrimination averaged across all participants.


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 7<br />

presented for 200 ms, 600 ms, 1000 ms, or 1400 ms),<br />

we manipulated the center-to-center spacing between the<br />

prime arrow and the flankers (i.e., they were presented<br />

randomly with a spacing of 1.4-, 2.4-, 3.4-, or 4.4-). We<br />

performed an ANOVA on correct response rate, with<br />

prime duration and spacing as main factors. We did not<br />

observe a significant effect of prime duration (F G 1), in<br />

coherence with the fact that crowding is insensitive to<br />

stimulus duration (Kooi, Toet, Tripathy, & Levi, 1994).<br />

Importantly, we found a main effect of spacing (F(1,4) =<br />

55.7; p G 0.01), with prime discrimination increasing<br />

when flankers were pulled aside, revealing the critical role<br />

of flanker position in prime discrimination. Furthermore,<br />

plotting of the discrimination performance against the<br />

prime-to-flankers distance revealed a horizontal ceiling at<br />

greater spacing, followed by a falling slope, a shape<br />

proposed by Pelli et al. (2004) as a criterion for crowding<br />

(see Figure 4).<br />

General discussion<br />

This study examined the dissociation between our<br />

subjective experience and our processing of crowded<br />

contents. For this purpose, we combined gaze-contingent<br />

crowding, a novel approach for preventing perceptual<br />

discrimination of peripheral stimuli, with a repetition<br />

priming paradigm that served as an index of nonconscious<br />

perceptual processing. By observing priming effects<br />

elicited by peripheral faces subject to self-crowding<br />

(Experiment 1) and crowded visual symbols (Experiment 2),<br />

we show that although crowded features are integrated<br />

into a subjectively jumbled texture, they are nonetheless<br />

preserved and used for subsequent processes including<br />

those underlying face recognition and directional symbol<br />

processing. The two major priming effects reported here<br />

have been previously observed with visual masking,<br />

posing GCC as one of its legitimate alternative. With<br />

regard to face priming, the effect of amplitude measured<br />

with GCC is similar to the one previously reported<br />

(Henson et al., 2008; Kouider et al., 2009). Similarly, we<br />

also found that only famous faces elicit nonconscious<br />

priming, suggesting that this effect arises when the<br />

subliminal prime triggers some preexisting target face<br />

representations. Alternatively, the absence of priming<br />

effect with nonfamous faces could be a consequence of<br />

the specific fame judgment task we used. Indeed, subjects’<br />

preexposure to the nonfamous prime might induce a<br />

feeling of familiarity of the target in related trials only<br />

(for which the target is the same as the prime), thus<br />

interfering with the fame judgment (see Jacoby, Kelley,<br />

Brown, & Jasechko, 1989). Concerning symbolic action<br />

priming, while the effects we report are highly significant,<br />

it is of note that their amplitude is globally smaller than<br />

what is usually observed using meta-contrast masking<br />

(Vorberg et al., 2003).<br />

Altogether, the present results extend previous findings<br />

that single feature informational contents are processed<br />

during crowding (e.g., line orientation; see He et al., 1996).<br />

Indeed, they reveal the correct capabilities of multifeature<br />

integration during crowding (e.g., in Experiment 2,<br />

only the correct building of a symbolic arrow from the<br />

binding of two opposite oriented lines can account for the<br />

priming effects we measured). Consequently, these results<br />

question the two-step model explaining the origins of<br />

crowding (Levi, 2008) and suggest that crowding arise<br />

from an impaired access to the integrated content rather<br />

than from an impaired featural integration per se. The fact<br />

that long-lasting crowded information is processed without<br />

consciousness at higher levels (i.e., multi-featural,<br />

involving face recognition and directional symbol processing)<br />

might reflect the obvious ecological relevance of<br />

peripheral vision. Indeed, contrary to masking, peripheral<br />

vision is omnipresent during perceptual life and probably<br />

results from evolutionary processes whereby visual pathways<br />

might have been tuned to efficiently process<br />

crowded contents. Thus, when facing a complex visual<br />

scene, the nonconscious processing of peripheral faces or<br />

sensorimotor cues might improve social interactions and<br />

spatial navigation, respectively. Furthermore, because it<br />

allows for the visual display of long-lasting complex<br />

objects, GCC might represent a suitable approach for a<br />

fine-grained probing of these visual pathways and allow<br />

for the study of phenomena such as sustained covert<br />

attention and temporal integration. Previous research has<br />

shown that when the peripheral prime is presented briefly,<br />

nonconscious repetition priming disappears above 4- of<br />

eccentricity when the prime and target appear at different<br />

locations (6- when both appear at the same location;<br />

Marzouki & Grainger, 2008), suggesting that brief<br />

peripheral stimuli have restricted impact on the cognitive<br />

system. Thus, increasing the strength (e.g., duration) of<br />

crowded stimuli seems to constitute a relevant, empirically<br />

based motivation. Along this line, it is important to<br />

stress that gaze-contingent substitution appears to be<br />

crucial since participants consistently tried to stare at the<br />

long-lasting prime in both experiments, despite the<br />

instructions to stare continuously at the target location<br />

and the automatic substitution rendering their attempts<br />

useless (see Figure 2). Further analyses revealed the<br />

efficiency of the gaze-contingent substitution. First, we<br />

found no significant difference regarding the prime<br />

visibility between trials in which participants stared<br />

continuously at the target location and trials in which<br />

they stared outside the target location (Welch’s t-test with<br />

p = 0.91 in Experiment 1; p = 0.34 in Experiment 2).<br />

Furthermore, for the trials in which participants stared<br />

outside the target location, we found no correlation<br />

between prime visibility and the total looking time<br />

outside the target location (slope = 1.2e j 04, p = 0.43


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 8<br />

in Experiment 1; slope = j6.8e j 05, p = 0.60 in<br />

Experiment 2; see Figure 5).<br />

It is important to stress that the locus of the priming<br />

effects observed in this study cannot result from low-level<br />

overlap: despite the congruent physical identity of the<br />

prime and targets, they were displayed at different, far<br />

apart locations on the screen. It remains unclear, however,<br />

whether these effects arise from cortical activity induced<br />

by striate and extrastriate routes or rather from direct<br />

subcortical pathways. Previous studies relying on nonconscious<br />

priming through visual masking have shown that<br />

both masked faces and masked arrows induce cortical<br />

responses, respectively, in the occipitotemporal cortex for<br />

face priming (Kouider et al., 2009) and from visual to<br />

motor cortical areas for action priming (Sack, van der<br />

Mark, Schuhmann, Schwarzbach, & Goebel, 2009).<br />

Investigating the neural correlates of the priming effects<br />

observed in this study would improve our comprehension<br />

of the origins of crowding. On one hand, there is evidence<br />

for the occurrence of featural integration as early as V1<br />

(Neri & Levi, 2006; Pelli, 2008), although these accounts<br />

do not predict the existence of informative extrastriate<br />

cortical activity during crowding. On the other hand, topdown<br />

accounts postulate a causal role for spatial attention<br />

occurring between V1 and the lateral occipital complex<br />

(Chakravarthi & Cavanagh, 2009). In our study, we found<br />

that decreasing the allocation of covert attention to the<br />

crowded prime (by increasing the attentional load of the<br />

task) roughly halved the magnitude of action priming.<br />

This suggests a two-step model in which the integration of<br />

the prime and flankers’ features occurs beyond V1 along<br />

the visual pathways (downstream integration), allowing<br />

for early nonconscious processing (upstream multi-featural<br />

processing). In this view, the different adjacent stimuli are<br />

processed independently as “uncrowded” by upstream<br />

neural systems and reach consciousness once integrated,<br />

via downstream neural activity, into a jumbled, texture-like<br />

appearance (Balas et al., 2009; Parkes et al., 2001). Thus,<br />

crowding might refer to a typical situation of partial<br />

consciousness (Kouider et al., 2010) in which the stimulus<br />

is perceived as a jumbled object because restricted levels<br />

of processing are consciously accessed, while most others<br />

remain below the threshold of consciousness.<br />

This finding also has important implication in the<br />

current debate concerning the dissociation between attention<br />

and consciousness (Koch & Tsuchiya, 2007), bringing<br />

additional evidence for attention without consciousness,<br />

which is the capacity to attend to something nondiscriminable.<br />

We show that nonconscious priming is modulated<br />

by spatial attention in addition to temporal attention<br />

(Naccache, Blandin, & Dehaene, 2002), This is in line<br />

with a previous study showing a similar attentional<br />

Figure 5. Linear regression between prime visibility and looking time outside the target location (i.e., triggering a gaze-contingent<br />

substitution) in Experiments 1 and 2. Each black dot stands for one prime discrimination trial, the position on the horizontal axis being<br />

defined by the looking time outside the target location, the position on the vertical axis being 1 in case of a correct response or 0 in case of<br />

an incorrect response on the prime visibility task. The continuous line represents the linear regression between the looking time and<br />

correct response rate. The dashed lines represent the intervals of confidence at 95%.


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 9<br />

dependence for the processing of crowded stimuli,<br />

restricted though to lower level visual adaptation measures<br />

(Montaser-Kouhsari & Rajimehr, 2005). Taken<br />

together, higher level priming effects and attentional<br />

modulation tend to support top-down accounts, according<br />

to which crowded information is not lost but rather not<br />

accessed due to an attentional deficit in the periphery.<br />

According to this perspective, attention modulates the<br />

widening of the integration window (Intriligator &<br />

Cavanagh, 2001). However, instead of attributing a causal<br />

role to spatial attention in crowding, our results suggest<br />

that, at the least, attention modulates upstream multifeatural<br />

processing in a nonconscious manner prior to<br />

integration. Consequently, we propose that the impact of<br />

top-down attention actually rests on the amplification of<br />

crowded sensory signals by increasing the signal-to-noise<br />

ratio (i.e., between prime and flankers) and thus increasing<br />

the probability of escaping crowding. Whether attention<br />

impacts both the nonconscious encoding of crowded<br />

information and the widening of the integration window<br />

remains an open question for future research.<br />

Acknowledgments<br />

The authors thank two anonymous reviewers for their<br />

useful comments. This work was supported by an REI<br />

(Recherche Exploratoire et Innovation) grant from the<br />

French government.<br />

Commercial relationships: none.<br />

Corresponding author: Nathan Faivre.<br />

Email: nathan.faivre@ens.fr.<br />

Address: LSCP, Ecole Normale Supérieure, 29 rue d’Ulm,<br />

75005 Paris, France.<br />

References<br />

Abrams, R. L., Klinger, M. R., & Greenwald, A. G. (2002).<br />

Subliminal words activate semantic categories (not<br />

automated motor responses). Psychonomic Bulletin &<br />

Review, 9, 100–106.<br />

Balas, B., Nakano, L., & Rosenholtz, R. (2009).<br />

A summary-statistic representation in peripheral vision<br />

explains visual crowding. Journal of Vision, 9(12):13,<br />

1–18, http://www.journalofvision.org/content/9/12/13,<br />

doi:10.1167/9.12.13. [PubMed] [Article]<br />

Bouma, H. (1970). Interaction effects in parafoveal letter<br />

recognition. Nature, 226, 177–178.<br />

Brainard, D. H. (1997). The psychophysics toolbox.<br />

Spatial Vision, 10, 433–436.<br />

Chakravarthi, R., & Cavanagh, P. (2007). Temporal<br />

properties of the polarity advantage effect in crowding.<br />

Journal of Vision, 7(2):11, 1–13, http://www.<br />

journalofvision.org/content/7/2/11, doi:10.1167/<br />

7.2.11. [PubMed] [Article]<br />

Chakravarthi, R., & Cavanagh, P. (2009). Recovery of a<br />

crowded object by masking the flankers: Determining the<br />

locus of feature integration. Journal of Vision, 9(10):4,<br />

1–9, http://www.journalofvision.org/content/9/10/4,<br />

doi:10.1167/9.10.4. [PubMed] [Article]<br />

Damian, M. F. (2001). Congruity effects evoked by<br />

subliminally presented primes: Automaticity rather<br />

than semantic processing. Journal of Experimental<br />

Psychology: Human Perception and Performance, 27,<br />

154–165.<br />

de Gardelle, V., & Kouider, S. (2010). How spatial<br />

frequencies and visual awareness interact during face<br />

processing. Psychological Science: A Journal of the<br />

American Psychological Society/APS, 21, 58–66.<br />

Fang, F., & He, S. (2008). Crowding alters the spatial<br />

distribution of attention modulation in human primary<br />

visual cortex. Journal of Vision, 8(9):6, 1–9, http://<br />

www.journalofvision.org/content/8/9/6, doi:10.1167/<br />

8.9.6. [PubMed] [Article]<br />

Farzin, F., Rivera, S. M., & Whitney, D. (2009). Holistic<br />

crowding of Mooney faces. Journal of Vision, 9(6):18,<br />

1–15, http://www.journalofvision.org/content/9/6/18,<br />

doi:10.1167/9.6.18. [PubMed] [Article]<br />

He, S., Cavanagh, P., & Intriligator, J. (1996). Attentional<br />

resolution and the locus of visual awareness. Nature,<br />

383, 334–337.<br />

Henson, R. N., Mouchlianitis, E., Matthews, W. J., &<br />

Kouider, S. (2008). Electrophysiological correlates of<br />

masked face priming. NeuroImage, 40, 884–895.<br />

Intriligator, J., & Cavanagh, P. (2001). The spatial<br />

resolution of visual attention. Cognitive Psychology,<br />

43, 171–216.<br />

Jacoby, L. L., Kelley, C., Brown, J., & Jasechko, J. (1989).<br />

Becoming famous overnight: Limits on the ability to<br />

avoid unconscious influences of the past. Journal of<br />

Personality & Social Psychology, 56, 326–338.<br />

Koch, C., & Tsuchiya, N. (2007). Attention and consciousness:<br />

Two distinct brain processes. Trends in<br />

Cognitive Sciences, 11, 16–22.<br />

Kooi, F. L., Toet, A., Tripathy, S. P., & Levi, D. M.<br />

(1994). The effect of similarity and duration on<br />

spatial interaction in peripheral vision. Spatial Vision,<br />

8, 255–279.<br />

Kouider, S., de Gardelle, V., Sackur, J., & Dupoux, E.<br />

(2010). How rich is consciousness? The partial<br />

awareness hypothesis. Trends in Cognitive Sciences,<br />

14, 301–307.


Journal of Vision (2011) 11(3):2, 1–10 Faivre & Kouider 10<br />

Kouider, S., & Dehaene, S. (2007). Levels of processing<br />

during non-conscious perception: A critical review of<br />

visual masking. Philosophical Transactions of the<br />

Royal Society of London B: Biological Sciences, 362,<br />

857–875.<br />

Kouider, S., & Dehaene, S. (2009). Subliminal number<br />

priming within and across the visual and auditory<br />

modalities. Experimental Psychology, 56, 418–433.<br />

Kouider, S., Dehaene, S., Jobert, A., & Le Bihan, D.<br />

(2007). Cerebral bases of subliminal and supraliminal<br />

priming during reading. Cerebral Cortex, 17, 2019–2029.<br />

Kouider, S., & Dupoux, E. (2004). Partial awareness<br />

creates the “illusion” of subliminal semantic priming.<br />

Psychological Science, 15, 75–81.<br />

Kouider, S., Eger, E., Dolan, R., & Henson, R. N. (2009).<br />

Activity in face-responsive brain regions is modulated<br />

by invisible, attended faces: Evidence from masked<br />

priming. Cerebral Cortex, 19, 13–23.<br />

Levi, D. M. (2008). CrowdingVAn essential bottleneck<br />

for object recognition: A mini-review. Vision<br />

Research, 48, 635–654.<br />

Louie, E. G., Bressler, D. W., & Whitney, D. (2007).<br />

Holistic crowding: Selective interference between configural<br />

representations of faces in crowded scenes.<br />

Journal of Vision, 7(2):24, 1–11, http://www.<br />

journalofvision.org/content/7/2/24, doi:10.1167/<br />

7.2.24. [PubMed] [Article]<br />

Martelli, M., Majaj, N. J., & Pelli, D. G. (2005). Are faces<br />

processed like words? A diagnostic test for recognition<br />

by parts. Journal of Vision, 5(1):6, 58–70,<br />

http://www.journalofvision.org/content/5/1/6,<br />

doi:10:1167/5.1.6. [PubMed] [Article]<br />

Marzouki, Y., & Grainger, J. (2008). Effects of prime and<br />

target eccentricity on masked repetition priming.<br />

Psychonomic Bulletin & Review, 15, 141–148.<br />

Montaser-Kouhsari, L., & Rajimehr, R. (2005). Subliminal<br />

attentional modulation in crowding condition. Vision<br />

Research, 45, 839–844.<br />

Naccache, L., Blandin, E., & Dehaene, S. (2002). Unconscious<br />

masked priming depends on temporal attention.<br />

Psychological Science: A Journal of the American<br />

Psychological Society/APS, 13, 416–424.<br />

Nandy, A. S., & Tjan, B. S. (2007). The nature of letter<br />

crowding as revealed by first- and second-order<br />

classification images. Journal of Vision, 7(2):5, 1–26,<br />

http://www.journalofvision.org/content/7/2/5,<br />

doi:10.1167/7.2.5. [PubMed] [Article]<br />

Neri, P., & Levi, D. M. (2006). Spatial resolution for<br />

feature binding is impaired in peripheral and<br />

amblyopic vision. Journal of Neurophysiology, 96,<br />

42–53.<br />

Parkes, L., Lund, J., Angelucci, A., Solomon, J. A., &<br />

Morgan, M. (2001). Compulsory averaging of<br />

crowded orientation signals in human vision. Nature<br />

Neuroscience, 4, 739–744.<br />

Pelli, D. G. (1997). The VideoToolbox software for visual<br />

psychophysics: Transforming numbers into movies.<br />

Spatial Vision, 10, 437–442.<br />

Pelli, D. G. (2008). Crowding: A cortical constraint on<br />

object recognition. Current Opinion in Neurobiology,<br />

18, 445–451.<br />

Pelli, D. G. (1985). Uncertainty explains many aspects of<br />

visual contrast detection and discrimination. Journal<br />

of the Optical Society of America A, 2, 1508–1532.<br />

Pelli, D. G., Palomares, M., & Majaj, N. J. (2004). Crowding<br />

is unlike ordinary masking: Distinguishing feature<br />

integration from detection. Journal of Vision, 4(12):12,<br />

1136–1169, http://www.journalofvision.org/content/<br />

4/12/12, doi:10.1167/4.12.12. [PubMed] [Article]<br />

Popple, A. V., & Levi, D. M. (2005). The perception<br />

of spatial order at a glance. Vision Research, 45,<br />

1085–1090.<br />

Sack, A. T., van der Mark, S., Schuhmann, T.,<br />

Schwarzbach, J., & Goebel, R. (2009). Symbolic<br />

action priming relies on intact neural transmission<br />

along the retino-geniculo-striate pathway. Neuro-<br />

Image, 44, 284–293.<br />

Vorberg, D., Mattler, U., Heinecke, A., Schmidt, T., &<br />

Schwarzbach, J. (2003). Different time courses for<br />

visual perception and action priming. Proceedings of<br />

the National Academy of Sciences, 100, 6275–6280.


2 Biais de préférence non conscient issu<br />

d’expressions faciales<br />

2.1 Présentation de l’étude<br />

Kouider, S., Berthet, V., & Faivre, N. (2011). Preference is biased by crowded<br />

facial expressions. Psychological Science, 22(2), 184–189.<br />

Introduction<br />

Dans cette étude, nous avons testé si l’influence du traitement non conscient pouvait<br />

gagner des niveaux supérieurs à ceux impliqués dans l’amorçage de répétition. Pour cela,<br />

nous avons conçu un paradigme en GCC dans lequel des participants préalablement exposés<br />

à des expressions faciales encombrées de valence positive (joie) ou négative (colère)<br />

étaient amenés à indiquer s’ils trouvaient plaisante ou non plaisante une cible abstraite<br />

subséquente (en l’occurrence, un caractère chinois). De manière parallèle à cette mesure<br />

indirecte de traitement non conscient, nous avons estimé la discriminabilité du stimulus<br />

encombré par une mesure objective directe. Le biais de préférence escompté devrait<br />

rendre compte d’un taux de réponses plaisantes supérieur après exposition à un visage<br />

joyeux comparé à un visage en colère, sans que les participants ne soient capables de<br />

distinguer consciemment parmi les deux expressions faciales. De plus, tirant parti de la<br />

possibilité en GCC de présenter des stimuli non discriminables de longue durée (ici plus<br />

de deux secondes), nous avons estimé ce biais de préférence à la fois pour des expressions<br />

faciales statiques (c’est à dire présentées sous forme de photographies), et dynamiques<br />

(c’est à dire présentées sous forme de vidéos dans lesquelles les acteurs expriment progressivement<br />

l’émotion puis la maintiennent dynamiquement). Les expressions faciales<br />

perçues consciemment étant mieux traitées sous leur forme dynamique, nous escomptions<br />

qu’elles induiraient un biais de préférence plus fort que leurs homologues statiques<br />

(Trautmann et al., 2009 ; voir cependant Fiorentini & Viviani (2011) pour des évidences<br />

70


CHAPITRE 2.<br />

BIAIS DE PRÉFÉRENCE NON CONSCIENT ISSU D’EXPRESSIONS FACIALES<br />

psychophysiques récentes allant à l’encontre de ce constat). Enfin, dans deux expériences<br />

contrôles, stimuli statiques et dynamiques ont été inversés (rotation de 180°) afin de nous<br />

assurer que le biais induit provenait d’un réel traitement émotionnel non conscient des<br />

visages, et non pas de différences de bas niveau potentielles entre les stimuli de valences<br />

positives et négatives (contraste, fréquences spatiales, etc.).<br />

Principaux résultats<br />

Tout d’abord, le paradigme utilisé a permis de rendre toutes les expressions faciales indiscriminables,<br />

les performances sur la mesure objective directe n’étant pas significativement<br />

différentes du niveau du hasard. Néanmoins, nous avons pu mesurer que les participants<br />

considéraient les caractères chinois comme plaisants environ 7% plus fréquemment lorsqu’ils<br />

étaient précédés d’un visage exprimant la joie plutôt que la colère. L’amplitude de<br />

ce biais de préférence non conscient était similaire pour les expressions faciales statiques<br />

et dynamiques. En revanche, lorsque les mêmes expressions étaient présentées inversées,<br />

aucun biais n’a pu être mesuré.<br />

Discussion<br />

Cette mesure nous a permis de sonder plus avant l’étendue du traitement non conscient<br />

d’information encombrée selon quatre axes. Premièrement, les visages périphériques étaient<br />

cette fois entourés de voisins sous forme de patterns, alors qu’ils étaient présentés de<br />

manière isolée dans la première étude, leur traits s’encombrant les uns les autres (autoencombrement,<br />

ou self-crowding). L’ajout de patterns était nécessaire, principalement<br />

pour empêcher la perception du mouvement des visages dynamiques qui aurait pu augmenter<br />

leur discriminabilité. Cela nous informe que le traitement d’informations faciales<br />

résiste aussi bien à l’auto-encombrement qu’à l’encombrement plus classique dû à la présence<br />

de voisins proches. Deuxièmement, le biais de préférence non conscient que nous<br />

avons mesuré signe la trace d’une influence au delà du traitement perceptuel de la cible<br />

comme c’est le cas dans l’amorçage de répétition. Nous reviendrons sur ces mécanismes<br />

dans le chapitre 4 page 113. Troisièmement, nous avons pu observer ce biais à la fois provenant<br />

de stimuli statiques, et de stimuli dynamiques. Malgré la pertinence écologique<br />

des indices temporels dans les expressions faciales, les biais de préférence étaient de même<br />

amplitude dans la condition dynamique et statique. Cela est attribuable tout d’abord à<br />

une trop pauvre sensibilité de la mesure comportementale employée, qui nous poussera<br />

71


CHAPITRE 2.<br />

BIAIS DE PRÉFÉRENCE NON CONSCIENT ISSU D’EXPRESSIONS FACIALES<br />

dans le chapitre 4 page 113 à utiliser des mesures neurales en IRMf. D’autre part, cela<br />

peut signifier également que les vidéos encombrées n’ont pas été traitées comme un flux<br />

visuel, mais comme une suite de clichés décorrélés les uns des autres 1 . Cela nous amènera<br />

à nous interroger sur les capacités d’intégration temporelle de l’inconscient cognitif<br />

dans la section 2.3 page 193. Quatrièmement, le fait de présenter les visages de manière<br />

inversée, ce qui a pour conséquence la perturbation des relations configurales existant<br />

entre leurs traits (Rossion, 2008, 2009), a aboli le biais de préférence. La démonstration<br />

du traitement holistique, ou configural 2 d’expressions faciales par leur inversion est déjà<br />

documenté en ce qui concerne la perception consciente (voir par exemple Calder & Jansen,<br />

2005; Derntl et al., 2009). Nos résultats étendent donc ce phénomène à la perception<br />

non consciente encombrée.<br />

Tel que nous l’avons conçu, le paradigme en GCC implique la simultanéité des mesures<br />

directes et indirectes, et donc le fait que les participants soient informés de la présence et<br />

de la nature des stimuli encombrés. Afin de tester l’étendue de leur influence d’un point<br />

de vue écologique, il serait intéressant de mesurer les biais de préférence qu’ils induisent<br />

lorsqu’ils sont inattendus. Cela pourrait s’opérationnaliser par l’application d’une charge<br />

attentionnelle, ou en n’informant pas les participants qui réaliseraient alors la tâche de<br />

visibilité après la mesure du biais de préférence. Même si les résultats de notre première<br />

étude suggèrent que le biais devrait être moindre, les résultats concernant le traitement<br />

de visages émotionnels inattendus divergent (Pessoa, 2005), ce qui laisse donc la question<br />

ouverte.<br />

2.2 Article<br />

1. Les traces non conscientes étant évanescentes, cela revient sensiblement au traitement de la dernière<br />

image de la vidéo, qui s’apparente fortement au stimulus statique.<br />

2. Ce phénomène regroupe plusieurs mécanismes, qui impliquent à la fois la représentation du visage<br />

comme un tout unifié, et l’encodage des relations spatiales existant entre ses différents traits (Maurer<br />

et al., 2002). Par la suite, et pour rester fidèle au terme employé dans nos articles, nous référerons à<br />

l’ensemble de ces mécanismes via le terme traitement configural (voir cependant Rossion, 2008, pour une<br />

discussion à ce sujet).<br />

72


Research Report<br />

Preference Is Biased by<br />

Crowded Facial Expressions<br />

Psychological Science<br />

XX(X) 1 –6<br />

© The Author(s) 2011<br />

Reprints and permission:<br />

sagepub.com/journalsPermissions.nav<br />

DOI: 10.1177/0956797610396226<br />

http://pss.sagepub.com<br />

Sid Kouider, Vincent Berthet, and Nathan Faivre<br />

Laboratoire de Sciences Cognitives et Psycholinguistique, CNRS/EHESS/DEC-ENS<br />

Abstract<br />

Crowding occurs when nearby flankers impede the identification of a peripheral stimulus. Here, we studied whether crowded<br />

features containing inaccessible emotional information can nevertheless affect preference judgments. We relied on gazecontingent<br />

crowding, a novel method allowing for constant perceptual unawareness through eye-tracking control, and we<br />

found that crowded facial expressions can bias evaluative judgments of neutral pictographs. Furthermore, this emotional bias<br />

was effective not only for static images of faces, but also for videos displaying dynamic facial expressions. In addition to showing<br />

an alternative approach for probing nonconscious cognition, this study reveals that crowded information, instead of being fully<br />

suppressed, can have important influences on decisions.<br />

Keywords<br />

nonconscious perception, crowding, face processing, emotions<br />

Received 6/13/10; Revision accepted 10/16/10<br />

The human eye constantly receives signals from the environment,<br />

yet people are aware of only a limited quantity of visual<br />

information. Indeed, a large part of the visual field is susceptible<br />

to the crowding phenomenon, in which peripheral objects<br />

appear jumbled when surrounded by similar neighbors. Crowding<br />

is commonly attributed to feature integration of the object<br />

and its flankers in an inappropriately large region, called an<br />

integration field (Levi, 2008; Pelli & Tillman, 2008). As a consequence,<br />

peripheral objects are no longer discriminable and<br />

give the impression of a texturelike percept. However, it<br />

remains unclear whether crowded stimuli are suppressed very<br />

early in the visual system (Pelli, 2008) or at later levels of processing<br />

(Intriligator & Cavanagh, 2001). If the latter, one might<br />

expect crowded objects to be encoded and maintained in the<br />

visual system despite unawareness and to eventually influence<br />

human behaviors in a nonconscious manner.<br />

Numerous studies have investigated the crowding of face<br />

stimuli, focusing primarily on the mechanism underlying the<br />

elimination of perceptual awareness. This research has<br />

revealed that crowding can occur selectively between highlevel,<br />

configurational representations of faces (Farzin, Rivera,<br />

& Whitney, 2009; Louie, Bressler, & Whitney, 2007) and that<br />

statistical information can be rapidly extracted from crowded<br />

faces (Haberman & Whitney, 2007). Yet research has largely<br />

neglected the extent to which crowded contents are still processed<br />

in the absence of perceptual awareness. A few notable<br />

exceptions are studies showing that low-level features (i.e.,<br />

line orientations) are preserved despite crowding and can<br />

induce visual adaptation (He, Cavanagh, & Intriligator, 1996).<br />

Whether crowded stimuli induce nonconscious influences at<br />

higher, nonperceptual levels (e.g., dealing with emotional or<br />

semantic content) is undetermined.<br />

The majority of research on nonconscious perception has<br />

relied on visual masking (Kouider & Dehaene, 2007; Marcel,<br />

1983). For example, researchers found that brain regions dealing<br />

with emotional information are activated even when fearful<br />

faces are presented very briefly (i.e., for less than 50 ms)<br />

and backward-masked, presumably in the absence of awareness<br />

(e.g., Whalen et al., 1998). However, such findings have<br />

proven difficult to replicate when visibility is stringently controlled<br />

(Pessoa, 2005; Pessoa, Japee, Sturman, & Ungerleider,<br />

2006). The fragility of subliminal influences in masking paradigms<br />

has been related to the strong degradation of visual signals,<br />

to prevent awareness. Indeed, because masking disrupts<br />

the efficient propagation of bottom-up activation in successive<br />

perceptual areas, subliminal influences are expected to<br />

decrease with synaptic distance, becoming small or undetectable<br />

in distant brain regions dealing with high-level information<br />

(Kouider & Dehaene, 2007).<br />

Corresponding Author:<br />

Sid Kouider, LSCP, Ecole Normale Supérieure, 29 rue d’Ulm, 75005 Paris,<br />

France<br />

E-mail: sid.kouider@ens.fr


2 Kouider et al.<br />

Another recent method for studying nonconscious perception<br />

is continuous flash suppression (CFS; Fang & He, 2005;<br />

Tsuchiya & Koch, 2005), an extension of binocular rivalry that<br />

consists of presenting one eye with a dynamic stream of<br />

contour-rich, high-contrast patterns in order to suppress from<br />

awareness the prime stimulus in the other eye. This method<br />

has the advantage of allowing for long stimulus durations, thus<br />

potentially increasing the strength of subliminal signals. However,<br />

in CFS, the largest suppression appears to occur relatively<br />

early in the visual system, impeding processing in<br />

higher visual regions of the ventral stream dealing with object<br />

and face recognition (Lin & He, 2009). It has recently been<br />

shown, using CFS, that although categorically congruent suppressed<br />

primes can facilitate the categorization of tools<br />

(assumed to be processed in the dorsal visual pathway), these<br />

primes have no effect on the categorization of nonmanipulable<br />

objects (assumed to be processed in the ventral visual pathway;<br />

Almeida, Mahon, Nakayama, & Caramazza, 2008). 1 In<br />

sum, although it is well documented that nonconscious perception<br />

involves low-level, sensorimotor pathways, evidence<br />

for influences at higher (e.g., emotional, semantic) levels<br />

remains scarce and is sometimes difficult to replicate (for<br />

reviews, see Kouider & Dehaene, 2007, on visual masking and<br />

Lin & He, 2009, on CFS).<br />

One possibility is that the observed weakness of subliminal<br />

influences reflects methodological rather than theoretical limitations.<br />

Methods consisting of bombarding one eye with<br />

flashes, as in CFS, or of masking a stimulus presented for only<br />

a few 10s of milliseconds, are likely to be confined to laboratory<br />

contexts. By contrast, crowding might constitute an interesting<br />

alternative approach because it occurs naturally and<br />

frequently in the perceptual environment. Furthermore, the<br />

human brain might even have been optimally tuned for processing<br />

certain peripheral stimuli (e.g., as part of danger<br />

avoidance). In this study, we investigated whether crowded<br />

faces expressing strong emotional content (happiness vs.<br />

anger) can influence preference judgments of neutral stimuli.<br />

Unlike masking and CFS, crowding does not impede stimulus<br />

detection. However, it is important to remember that some<br />

aspects of the crowded stimulus (e.g., emotional content)<br />

might remain nondiscriminable under certain conditions.<br />

One main difficulty with manipulating peripheral contents<br />

is that stimuli conveying salient information (e.g., strong emotional<br />

information) naturally attract attention and foveal focus.<br />

To overcome this problem, we developed an approach termed<br />

gaze-contingent crowding (GCC), which consists of presenting<br />

long-lasting (i.e., 2,500 ms) peripheral stimuli that are<br />

crowded by surrounding flankers while precluding foveal<br />

access through high-resolution eye tracking (see Fig. 1). The<br />

gaze-contingent control consisted of substituting the crowded<br />

stimulus with irrelevant content as soon as the observer’s gaze<br />

diverged from an arbitrary fixation location. Thus, the method<br />

reliably prevented conscious access to the emotional content<br />

of the stimulus. This approach allowed us to determine whether<br />

Time<br />

Valence Task<br />

Visibility Task<br />

Happiness?<br />

18°<br />

Emotion Paroxysm<br />

+<br />

or<br />

150 ms Until Response<br />

Fixation<br />

+<br />

<br />

2,500 ms<br />

300 ms<br />

Fig. 1. Illustration of the gaze-contingent crowding procedure. Each trial consisted of the presentation of a fixation cross,<br />

followed by a peripheral emotional face surrounded by flankers. The emotional face was replaced by the same face with a<br />

neutral expression as soon as the participant ceased to gaze at the fixation cross. This event was followed, randomly, either<br />

by a Chinese pictograph (valence task) or by the question “anger?” or “happiness?” (referring to the emotion of the prime;<br />

visibility task). Participants made evaluative judgments (pleasant/unpleasant) on pictographs (measure of prime influence)<br />

and answered “yes” or “no” to the questions (i.e., reported whether or not the prime expressed the indicated emotion;<br />

measure of prime discrimination). Depending on condition, the prime faces were static or dynamic.


Preference Is Biased by Crowded Facial Expressions 3<br />

crowded faces, presented not only statically but also dynamically<br />

(i.e., like movie sequences) can bias preference judgments<br />

in a nonconscious manner.<br />

Method<br />

Participants<br />

A total of 79 French college students (age range = 18–35 years)<br />

participated in the study. They were paid €10 for their participation.<br />

All had normal or corrected-to-normal vision and were<br />

unable to read Chinese.<br />

Stimuli and procedure<br />

Participants sat 57 cm from a computer screen. On each trial,<br />

they stared at a 0.5° × 0.5° fixation cross while the prime face<br />

(3.2° × 3.9°) was displayed either statically or dynamically for<br />

2,500 ms (18° center-to-center eccentricity between face and<br />

cross). The prime face was surrounded by six noninformative<br />

pattern flankers (2.5° × 2.8°; 3.1° center-to-center eccentricity<br />

between face and flankers). Whenever a participant ceased to<br />

gaze at a 5° × 5° invisible zone around fixation, the face was<br />

replaced by the same face with a neutral expression (with a<br />

maximum delay of two screen refreshes). This procedure<br />

guaranteed that the emotional information in the face was<br />

never accessed foveally. Then, at the fixation location, either<br />

(a) an unknown Chinese pictograph (3° × 3°) or (b) the question<br />

“anger?” or “happiness?” was presented. The pictograph<br />

was displayed for 150 ms, and participants were expected to<br />

indicate whether or not it was pleasant (measure of prime<br />

influence; 120 trials); the word question was displayed until<br />

the participant indicated whether or not the word corresponded<br />

to the facial expression of the prime (measure of prime discrimination;<br />

60 trials). The two kinds of trials were intermixed<br />

randomly, so participants could not predict their task on a<br />

given trial. Processing during the prime presentation was thus<br />

identical under both conditions. Prime valence (i.e., happiness<br />

or anger) was manipulated within participants, and prime type<br />

(i.e., static or dynamic) between participants.<br />

Prime stimuli were obtained by videotaping five professional<br />

actresses demonstrating dynamic expressions of happiness<br />

and anger. Videos were speeded up or down slightly to<br />

compensate for differences in timing between the different<br />

actors’ expressions. Each video started with a neutral expression<br />

(500 ms), followed by emotional progression until paroxysm<br />

(1,000 ms), and finally dynamic maintenance at the peak<br />

level (1,000 ms). Static faces were extracted from each movie;<br />

neutral expressions were taken from the 0-ms point in the videos,<br />

and emotional-paroxysm expressions were taken from the<br />

1,500-ms point. Stimuli were matched for average luminance,<br />

contrast, size, and (for movies) timing of expression progression.<br />

The flankers were noninformative patterns created by<br />

overlaying faces and objects (de Gardelle & Kouider, 2010).<br />

Their luminance was 40% higher than that of the primes. The<br />

display was controlled by the Psychophysics Toolbox (Brainard,<br />

1997; Pelli, 1997). Stimuli were presented against a black<br />

background (0.004 cd/m 2 ) on a 22-in. screen (frame rate:<br />

85 Hz; resolution: 1,024 × 768 pixels). Eye movements were<br />

recorded monocularly with a tower-mounted eye tracker<br />

(Eyelink 1000 system, SR Research, Mississauga, Ontario,<br />

Canada; sampling rate: 1000 Hz; spatial resolution: ≥ 1°).<br />

Results<br />

Target pictographs were evaluated as pleasant at a mean rate of<br />

55.7% (SD = 9.5%). Crucially, evaluation of the pictographs<br />

was significantly modulated by prime valence; the rate at<br />

which the pictographs were judged pleasant was 6.8% higher<br />

following happy faces than following angry faces, F(1, 41) =<br />

9.08, p < .005 (see Fig. 2). The interaction between prime<br />

valence and prime type was not significant, F < 1, as the magnitude<br />

of the bias was equivalent for static primes (6.7%),<br />

t(21) = 2.17, p < .05, and dynamic primes (7.0%), t(20) = 2.10,<br />

p < .05. Debriefing after the experiment revealed that none<br />

of the participants could detect the emotion expressed by<br />

the crowded faces. Signal detection analysis on the primediscrimination<br />

trials revealed chance-level performance both<br />

for static primes (mean d′ = 0.02), t(21) = 0.21, p = .84, and for<br />

dynamic primes (mean d′ = 0.18), t(20) = 1.57, p = .13, confirming<br />

that GCC successfully prevented access to emotional<br />

information in the periphery. It is noteworthy that although<br />

participants complied with the instructions in a majority of trials,<br />

they also attempted to stare specifically at the prime on<br />

9.5% (SD = 7.0%) of the trials (1.7%, SD = 1.4%, of total fixation<br />

time; see Fig. S1 in the Supplemental Material available<br />

online). This tendency was constant across the whole protocol,<br />

which suggests that gaze-contingent control is a crucial<br />

manipulation for preventing the identification of peripheral<br />

stimuli.<br />

Although the stimuli were matched for low-level properties<br />

on several dimensions, one possible reason for the effect<br />

of prime valence might be that there were still systematic,<br />

unaccounted-for differences between the stimuli displaying<br />

angry and happy faces. In order to rule out this possibility, we<br />

conducted an additional, control experiment using the same<br />

procedure, design, and materials as before, except that the<br />

faces were presented as upside-down images and upside-down<br />

videos. In these conditions, participants’ evaluations of the<br />

pictographs were not influenced by prime valence (0.4% difference<br />

for static stimuli and −1.01% difference for dynamic<br />

stimuli, both Fs < 1). Thus, the decision bias observed with<br />

upright faces reflects a genuine extraction of emotional information<br />

from them.<br />

Discussion<br />

In this study, we used a new method, GCC, that allows for<br />

the long-lasting presentation of nonconscious visual signals in<br />

the periphery. We found that a crowded stimulus conveying


4 Kouider et al.<br />

65<br />

n = 22<br />

Anger<br />

Happiness<br />

60<br />

“Pleasant” Response Rate (%)<br />

55<br />

50<br />

n = 21 n = 18<br />

n = 18<br />

45<br />

Static Faces<br />

Dynamic Faces<br />

Main Experiment<br />

Static Faces<br />

Upside-Down<br />

Dynamic Faces<br />

Upside-Down<br />

Control Experiment<br />

Fig. 2. Mean percentage of unknown Chinese pictographs judged as pleasant in the main<br />

experiment (upright faces) and the control experiment (upside-down faces). Percentages are<br />

shown as a function of prime type (static or dynamic) and prime valence (anger or happiness).<br />

Error bars denote 1 SE. The number of participants tested in each condition is shown.<br />

emotional information can bias evaluative judgment of a neutral,<br />

unknown target. Furthermore, this nonconscious emotional<br />

influence was not exerted when the crowded faces were inverted,<br />

a result confirming that the emotional effect we observed has a<br />

configurational, rather than featural, origin. <strong>These</strong> results have<br />

several implications.<br />

One implication concerns the phenomenon of crowding<br />

itself. Crowding occurs when the features of an object and its<br />

flankers are integrated into the same integration field, which<br />

results in a jumbled percept in which the object cannot be discriminated.<br />

It is agreed that the size of the integration field<br />

increases with eccentricity, but the origin of this widening is<br />

debated. According to bottom-up proposals, integration fields<br />

are materialized in primary visual cortex (Pelli, 2008). This<br />

hardwired limitation would imply a loss of information for<br />

crowded stimuli at and beyond V1. According to top-down<br />

proposals, the size of the integration field is the size of the<br />

spotlight of attention (Intriligator & Cavanagh, 2001), which<br />

suggests that crowded information is present in the visual<br />

system but remains inaccessible because of inattention. Our<br />

results extend these findings by showing that crowded<br />

emotional features that cannot be discriminated are preserved<br />

and are able to bias behaviors.<br />

One might still argue for a bottom-up account, according to<br />

which the emotional effect we observed reflects subcortical processing<br />

of faces, bypassing cortical pathways. Indeed, LeDoux<br />

(1998) described two alternative cerebral routes for emotion<br />

processing: the thalamo-amygdala pathway (short route) and<br />

the thalamo-cortico-amygdala pathway (long route). Studies<br />

with blindsight patients suggest that, instead of engaging ventral<br />

(i.e., occipito-temporal) pathways in the visual cortex, perception<br />

of emotions engages alternative subcortical regions such as<br />

the superior colliculus and the pulvinar, which are connected to<br />

the amygdala without any cortical relay (de Gelder, Vroomen,<br />

Pourtois, & Weiskrantz, 1999). However, strong evidence for<br />

the existence of connections between the amygdala and the pulvinar<br />

in humans is still lacking (Pessoa, 2005). Furthermore,<br />

stimulus processing in the suppressed hemifield of blindsight<br />

patients has also been correlated not only with subcortical<br />

regions but also with cortical visual regions (e.g., MT+, lateral<br />

occipital complex) that are probably engaged as a result of<br />

residual V1 activity (Goebel, Muckli, Zanella, Singer, &


Preference Is Biased by Crowded Facial Expressions 5<br />

Stoerig, 2001). <strong>These</strong> cortical regions could then elicit the<br />

amygdala, and amygdala activity would then be falsely interpreted<br />

as being due to processing by the short route. Furthermore,<br />

a patient with complete bilateral lesions in the amygdala<br />

has been reported to process subliminal fearful stimuli without<br />

notable differences from normal participants (Tsuchiya, Moradi,<br />

Felsen, Yamazaki, & Adolphs, 2009), which suggests that the<br />

amygdala is not necessary for nonconscious, rapid fear detection,<br />

but rather plays a belated role (once cortical processing has<br />

taken place) in face representation, modulation of social judgments,<br />

and other higher-order cognitive processes.<br />

It is important to note that we found that inverted crowded<br />

faces were not processed as emotional stimuli. Recently, it has<br />

been debated whether the differences between the processing<br />

of upright faces and the processing of inverted faces are quantitative<br />

or qualitative (Sekuler, Gaspar, Gold, & Bennett,<br />

2004). In any case, physiological measures indicate that these<br />

differences arise from cortical regions along the ventral visual<br />

pathways, such as the fusiform face area (Kanwisher & Yovel,<br />

2006). Thus, it is tempting to consider our result as evidence<br />

for the nonconscious maintenance of crowded information in<br />

cortical areas beyond V1 (Greenwood, Bex, & Dakin, 2010;<br />

Parkes, Lund, Angelucci, Solomon, & Morgan, 2001).<br />

We found that GCC could be used to demonstrate influences<br />

from both static pictures and videos. However, we did not<br />

observe greater emotional effects for dynamic stimuli than for<br />

static stimuli, although such a difference is usually found for<br />

visible faces (Trautmann, Fehr, & Herrmann, 2009). The fact<br />

that we did not observe the same pattern as for visible faces has<br />

important implications regarding the limits of nonconscious<br />

processing, as the possibility of sequential processing without<br />

awareness remains an important but unsettled question. One<br />

possibility is that a processing advantage for dynamic stimuli<br />

occurs only during the conscious perception of emotional content.<br />

Future experiments examining the differential processing<br />

of crowded and uncrowded (i.e., discriminable) stimuli might<br />

be necessary to shed light on this issue. If the processing advantage<br />

for dynamic stimuli is restricted to uncrowded displays,<br />

that would suggest that crowded movies are not processed as<br />

dynamic stimuli per se and are thus not integrated across time.<br />

Alternatively, it remains possible that the evaluative judgments<br />

we elicited in our experiment were not sensitive enough to the<br />

static/dynamic manipulation. In that case, investigating the<br />

neural response associated with the processing of crowded<br />

dynamic and static displays may be useful in investigating the<br />

possibility of nonconscious temporal integration.<br />

Finally, regarding the phenomenology of crowding, it is<br />

important to point out that crowding constitutes a prototypical<br />

situation of partial awareness (Kouider, de Gardelle, Sackur,<br />

& Dupoux, 2010) in which the stimulus is perceived as a jumbled<br />

object because restricted levels of processing are<br />

consciously accessed while most others remain below the<br />

threshold of consciousness. Although participants in our<br />

experiment could detect the presence of a crowded stimulus<br />

(as a texturelike pattern), the stimulus features that were<br />

diagnostic for priming effects (emotional attributes) were<br />

impossible to discriminate and therefore had nonconscious<br />

influences on responses relying on that particular type of<br />

information. Together, these results suggest that although<br />

crowding constitutes a bottleneck in object recognition, limiting<br />

conscious access when there is an overflow of visual signals,<br />

it spares the environmental information that is necessary<br />

for nonconscious behavioral responses.<br />

Acknowledgments<br />

The authors thank Arnaud Piketty for stimulus preparation and two<br />

anonymous reviewers for their comments.<br />

Declaration of Conflicting Interests<br />

The authors declared that they had no conflicts of interest with<br />

respect to their authorship or the publication of this article.<br />

Funding<br />

This work was supported by an REI (Recherche Exploratoire<br />

et Innovation) grant from the French government.<br />

Supplemental Material<br />

Additional supporting information may be found at http://pss.sagepub​<br />

.com/content/by/supplemental-data<br />

Note<br />

1. In addition, CFS poses practical problems for preventing awareness<br />

constantly during an experiment, because suppression can be<br />

broken at any moment when participants just close one eye.<br />

References<br />

Almeida, J., Mahon, B.Z., Nakayama, K., & Caramazza, A. (2008).<br />

Unconscious processing dissociates along categorical lines.<br />

Proceedings of the National Academy of Sciences, USA, 105,<br />

15214–15218.<br />

Brainard, D.H. (1997). The Psychophysics Toolbox. Spatial Vision,<br />

10, 433–436.<br />

de Gardelle, B., & Kouider, S. (2010). How spatial frequencies and<br />

visual awareness interact during face processing. Psychological<br />

Science, 21, 58–66.<br />

de Gelder, B., Vroomen, J., Pourtois, G., & Weiskrantz, L. (1999).<br />

Non-conscious recognition of affect in the absence of striate cortex.<br />

NeuroReport, 10, 3759–3763.<br />

Fang, F., & He, S. (2005). Cortical responses to invisible objects in<br />

the human dorsal and ventral pathways. Nature Neuroscience, 8,<br />

1380–1385.<br />

Farzin, F., Rivera, S.M., & Whitney, D. (2009). Holistic crowding of<br />

Mooney faces. Journal of Vision, 9(6), Article 18. Retrieved from<br />

http://journalofvision.org/9/6/18<br />

Goebel, R., Muckli, L., Zanella, F., Singer, W., & Stoerig, P. (2001).<br />

Sustained extrastriate cortical activation without visual awareness<br />

revealed by fMRI studies of hemianopic patients. Vision<br />

Research, 41, 1459–1474.<br />

Greenwood, J.A., Bex, P.J., & Dakin, S.C. (2010). Crowding changes<br />

appearance. Current Biology, 20, 496–501.


6 Kouider et al.<br />

Haberman, J., & Whitney, D. (2007). Rapid extraction of mean<br />

emotion and gender from sets of faces. Current Biology, 17,<br />

R751–R753.<br />

He, S., Cavanagh, P., & Intriligator, J. (1996). Attentional resolution<br />

and the locus of visual awareness. Nature, 383, 334–337.<br />

Intriligator, J., & Cavanagh, P. (2001). The spatial resolution of visual<br />

attention. Cognitive Psychology, 43, 171–216.<br />

Kanwisher, N., & Yovel, G. (2006). The fusiform face area: A cortical<br />

region specialized for the perception of faces. Philosophical<br />

Transactions of the Royal Society B: Biological Sciences, 361,<br />

2109–2128.<br />

Kouider, S., de Gardelle, V., Sackur, J., & Dupoux, E. (2010). How<br />

rich is consciousness? The partial awareness hypothesis. Trends<br />

in Cognitive Sciences, 14, 301–307.<br />

Kouider, S., & Dehaene, S. (2007). Levels of processing during<br />

non-conscious perception: A critical review of visual masking.<br />

Philosophical Transactions of the Royal Society B: Biological<br />

Sciences, 362, 857–875.<br />

LeDoux, J.E. (1998). The emotional brain: The mysterious underpinnings<br />

of emotional life. New York, NY: Simon & Schuster.<br />

Levi, D.M. (2008). Crowding—an essential bottleneck for object recognition:<br />

A mini-review. Vision Research, 48, 635–654.<br />

Lin, Z., & He, S. (2009). Seeing the invisible: The scope and limits<br />

of unconscious processing in binocular rivalry. Progress in Neurobiology,<br />

87, 195–211.<br />

Louie, E.G., Bressler, D.W., & Whitney, D. (2007). Holistic crowding:<br />

Selective interference between configural representations<br />

of faces in crowded scenes. Journal of Vision, 7(2), Article 24.<br />

Retrieved from http://journalofvision.org/7/2/24/<br />

Marcel, A.J. (1983). Conscious and unconscious perception: Experiments<br />

on visual masking and word recognition. Cognitive Psychology,<br />

15, 197–237.<br />

Parkes, L., Lund, J., Angelucci, A., Solomon, J.A., & Morgan, M.<br />

(2001). Compulsory averaging of crowded orientation signals in<br />

human vision. Nature Neuroscience, 4, 739–744.<br />

Pelli, D.G. (1997). The VideoToolbox software for visual psychophysics:<br />

Transforming numbers into movies. Spatial Vision, 10,<br />

437–442.<br />

Pelli, D.G. (2008). Crowding: A cortical constraint on object recognition.<br />

Current Opinion in Neurobiology, 18, 445–451.<br />

Pelli, D.G., & Tillman, K.A. (2008). The uncrowded window of<br />

object recognition. Nature Neuroscience, 11, 1129–1135.<br />

Pessoa, L. (2005). To what extent are emotional visual stimuli processed<br />

without attention and awareness? Current Opinion in Neurobiology,<br />

15, 188–196.<br />

Pessoa, L., Japee, S., Sturman, D., & Ungerleider, L.G. (2006). Target<br />

visibility and visual awareness modulate amygdala responses to<br />

fearful faces. Cerebral Cortex, 16, 366–375.<br />

Sekuler, A.B., Gaspar, C.M., Gold, J.M., & Bennett, P.J. (2004).<br />

Inversion leads to quantitative, not qualitative, changes in face<br />

processing. Current Biology, 14, 391–396.<br />

Trautmann, S., Fehr, T., & Herrmann, M. (2009). Emotions in<br />

motion: Dynamic compared to static facial expressions of disgust<br />

and happiness reveal more widespread emotion-specific activations.<br />

Brain Research, 1284, 100–115.<br />

Tsuchiya, N., & Koch, C. (2005). Continuous flash suppression reduces<br />

negative afterimages. Nature Neuroscience, 8, 1096–1101.<br />

Tsuchiya, N., Moradi, F., Felsen, C., Yamazaki, M., & Adolphs, R.<br />

(2009). Intact rapid detection of fearful faces in the absence of the<br />

amygdala. Nature Neuroscience, 12, 1224–1225.<br />

Whalen, P.J., Rauch, S.L., Etcoff, N.L., McInerney, S.C., Lee, M.B.,<br />

& Jenike, M.A. (1998). Masked presentations of emotional facial<br />

expressions modulate amygdala activity without explicit knowledge.<br />

The Journal of Neuroscience, 18, 411–418.


3 Stimulation visuelle et profondeur du<br />

traitement non conscient<br />

Faivre, N., Berthet, V., & Kouider, S. (under review). Visual Stimulation<br />

Determines the Depth of Nonconscious Face Processing. Consciousness and<br />

Cognition.<br />

3.1 Présentation de l’étude<br />

Introduction<br />

Dans cette troisième étude, nous avons affiné et étendu les premiers résultats obtenus précédemment<br />

concernant les biais de préférence non conscients. Tout d’abord, avec le même<br />

paradigme expérimental que dans la deuxième étude, nous avons affiné les liens entre traitement<br />

non conscient et niveau d’encombrement. En effet, dans l’étude précédente, nous<br />

avons trouvé qu’encombrer les traits des visages en les entourant de voisins épargnait leur<br />

traitement configural. Ici, nous avons testé si l’encombrement de l’information configurale<br />

des mêmes visages émotionnels par la présence de visages neutres épargnait malgré<br />

tout leur traitement configural non conscient. De plus, nous avons affiné les mesures de<br />

biais de préférence non conscient avec une deuxième expérience comportant une ligne de<br />

base avec des expressions faciales statiques et dynamiques neutres. Cela nous a permis<br />

de comparer les influences respectives des valences positives et négatives sur le biais de<br />

préférence.<br />

Par ailleurs, l’intérêt de cette étude se trouve également dans la comparaison méthodologique<br />

systématique qu’elle propose. Nous avons en effet réalisé les mêmes mesures de<br />

biais de préférence en empêchant l’accès conscient aux expressions faciales à la fois par<br />

le masquage visuel et le CFS, afin de comparer les différents niveaux de traitement non<br />

conscient autorisés par chaque méthode.<br />

79


CHAPITRE 3.<br />

STIMULATION VISUELLE ET PROFONDEUR DU TRAITEMENT NON CONSCIENT<br />

Principaux résultats<br />

En GCC, nous avons trouvé que les processus donnant lieu au biais de préférence étaient<br />

épargnés aussi bien lorsque les visages émotionnels étaient encombrés au niveau de leurs<br />

traits par des patterns, ou au niveau de leur information configurale par d’autres visages<br />

neutres. De plus, la deuxième expérience comportant une ligne de base nous a permis<br />

de mettre à jour que le biais de préférence provenait spécifiquement de la présence des<br />

visages exprimant la joie, que ce soit de manière statique ou dynamique. En effet, si<br />

la préférence était significativement biaisée par les visages exprimant la joie comparé<br />

aux visages neutres, aucun biais significatif n’a pu être mis en évidence par les visages<br />

exprimant la colère. Enfin, une réplication de la deuxième expérience en condition de<br />

perception consciente a montré que cette restriction du biais aux valences positives était<br />

spécifique à la condition encombrée, puisque des biais conscients ont pu être induits aussi<br />

bien par des visages exprimant la joie que la colère.<br />

Avec le même paradigme, l’utilisation du masquage visuel avec des stimuli statiques, et du<br />

CFS avec à la fois des stimuli statiques et dynamiques ne nous a pas permis d’observer un<br />

biais de préférence non conscient. En revanche, lors d’une tâche d’amorçage de répétition<br />

impliquant la reconnaissance émotionnelle d’un visage cible, ces mêmes stimuli ont induit<br />

une modulation des temps de réaction dans les deux paradigmes.<br />

Discussion<br />

En GCC, nous avons trouvé une double dissociation entre niveau d’encombrement et<br />

traitement non conscient. En effet, on sait le traitement configural des visages être à<br />

l’origine du biais de préférence. Or, l’encombrement des traits aussi bien que l’encombrement<br />

configural autorise son occurence. La deuxième expérience a précisé l’origine du<br />

biais aux expressions faciales de joie, ce qui corrèle avec des études précédentes suggérant<br />

un traitement favorisé de cette émotion en périphérie du champ de vision, cela potentiellement<br />

en lien avec sa composition en basses fréquences spatiales (Smith & Schyns, 2009;<br />

Goren & Wilson, 2006). De nouveau, l’amplitude similaire du biais de préférence entre<br />

expressions statiques et dynamiques ne nous permet pas de statuer sur un traitement<br />

spécifique d’indices temporels en l’absence d’accès conscient.<br />

Les comparaisons méthodologiques systématiques que nous avons réalisées dans cette<br />

étude montrent à quel point l’estimation de la profondeur de l’inconscient cognitif est<br />

80


CHAPITRE 3.<br />

STIMULATION VISUELLE ET PROFONDEUR DU TRAITEMENT NON CONSCIENT<br />

une tâche délicate. Ici, l’utilisation isolée du masquage ou du CFS aurait conduit à une<br />

conclusion erronée sur la limite de l’inconscient cognitif pour cette tâche bien précise. Or,<br />

la quête des corrélats neuraux de la conscience par une approche contrastive requiert que<br />

les limites attribuées à la cognition non consciente émergent des propriétés intrinsèques<br />

du système, et non pas de limites méthodologiques. Il nous apparaît crucial de multiplier<br />

ces comparaisons, et de les étendre à des tâches cognitives d’ordre plus général. Les résultats<br />

négatifs obtenus avec l’utilisation du masquage et du CFS s’expliquent en partie<br />

par les conséquences drastiques de ces deux méthodes sur le système visuel. En masquage,<br />

la présence du masque juste après le visage a pu empêcher l’activité ré-entrante<br />

nécessaire à son traitement configural fin (Lamme & Roelfsema, 2000). Le CFS quant<br />

à lui interrompt potentiellement le traitement visuel au sein de la voie ventrale, comme<br />

indiqué par une étude précédente (Almeida et al., 2008). Néanmoins, le contrôle réalisé<br />

avec les expériences d’amorçage de répétition montrent que ces deux méthodes rendaient<br />

possible un traitement perceptuel des visages émotionnels. Il pourrait donc s’agir d’une<br />

situation dans laquelle le traitement perceptuel intervient pour chaque méthode, mais<br />

où seul le GCC préserve les opérations cognitives en aval de ce traitement qui donnent<br />

naissance au biais de préférence. L’étude suivante basée sur la neuroimagerie précise la<br />

nature de ces opérations.<br />

3.2 Article<br />

81


Visual Stimulation Determines The Depth<br />

of Nonconscious Face Processing<br />

Nathan Faivre, Vincent Berthet, and Sid Kouider<br />

Laboratoire de Sciences Cognitives et Psycholinguistique, CNRS/EHESS/DEC-ENS, Paris, France.<br />

Send correspondance to: Nathan Faivre, LSCP, Ecole Normale Supérieure, 29 rue d'Ulm, 75005<br />

Paris, France. Phone: +33 1 44 32 26 25. E-mail: nathan.faivre@ens.fr<br />

Keywords: consciousness, face processing, emotion, crowding, GCC, CFS, masking.


Abstract<br />

In the domain of nonconscious perception, several methods allowing for the prevention of visual<br />

awareness have flourished. While their properties are now well described, the level at which each of<br />

them disrupts nonconscious processing remains unclear. However, delimiting the frontier between<br />

conscious and nonconscious cognition requires an accurate estimation of the depth of nonconscious<br />

processes. Here, we compared the processing of facial expressions rendered invisible through gazecontingent<br />

crowding (GCC), visual masking, and continuous flash suppression (CFS), three<br />

techniques relying on different visual properties. We found that both pictures and videos of happy<br />

faces suppressed from awareness by GCC were processed such as biasing subsequent preference<br />

judgments, while the same stimuli manipulated with visual masking and CFS elicited perceptual<br />

priming only. <strong>These</strong> results provide new insights regarding the nonconscious impact of emotional<br />

features, and suggest the crucial importance of methodological comparisons before concluding on<br />

the depth of nonconscious cognition.


1. Introduction<br />

Over the past twenty years, it has been clearly established that stimuli remaining inaccessible to<br />

conscious reports are processed such as to influence behavioral and neural responses (Marcel, 1983;<br />

Kouider & Dehaene, 2007). Reliable measures of nonconscious perception require a sensory<br />

stimulation of maximum energy in order to elicit robust influences, while ensuring a strict control of<br />

stimulus visibility in order to avoid potential confounds with conscious processes. So far, in the<br />

domain of nonconscious vision, researchers have relied on two main perceptual manipulations,<br />

namely visual masking and continuous flash suppression (CFS) (see Kim & Blake, 2005, for other<br />

techniques relying notably on attentional manipulations). In visual masking, a short-lasting stimulus<br />

(i.e., below 50ms) is immediately followed by a visual pattern called the mask, and becomes<br />

impossible to detect (Breitmeyer, & Ögmen, 2006; Di Lollo, Enns, & Rensink, 2000). In CFS, one<br />

eye is presented with the stimulus of interest, while the other eye is presented with a dynamic<br />

stream of salient patterns called mondrians. Due to binocular rivalry, the stimulus of interest is<br />

suppressed from awareness and remains undetectable even after long exposure of several seconds<br />

(Tsuchiya & Koch, 2005). <strong>These</strong> two approaches have been extremely fruitful to describe the depth<br />

of nonconscious cognition (see Kouider & Dehaene, 2007 for a review on visual masking, and Lin<br />

& He, 2009 for a review on CFS). Surprisingly, to our knowledge, only one study compared<br />

systematically the fate of stimuli suppressed from awareness by visual masking and CFS (Almeida,<br />

Mahon, Nakayama, & Caramazza, 2008, see discussion). However, further methodological<br />

comparisons are necessary in the context of contrastive research on consciousness (Baars, 1997).<br />

Indeed, if one tries to infer the neural correlates of consciousness from a contrast between conscious<br />

and nonconscious cognition, one has to be sure that the limits attributed to nonconscious processes<br />

are substantive to nonconscious cognition, and do not arise from methodological limitations.


Here, we present new results on nonconscious perception from a third alternative involving visual<br />

crowding. Visual crowding reflects the fact that a peripheral stimulus appears jumbled and become<br />

undiscriminable when surrounded by similar flankers. By contrast to both masking and CFS, the<br />

detection of a crowded stimulus is prevented, since observers are able to report its presence.<br />

Nonetheless, properties of the crowded stimulus which are shared with the flankers are not<br />

reportable. Interestingly, this impairment of stimulus discriminability is not restored by a longer<br />

stimulus exposure (Kooi, Toet, Tripathy, & Levi, 1994), which allows for long-lasting presentation<br />

without awareness. In order to control for stimulus discriminability, we implemented crowding with<br />

an eye-tracking based control, resulting in a method we called gaze-contingent crowding (GCC;<br />

Faivre & Kouider, 2011; Kouider, Berthet and Faivre, 2011). GCC allows for the substitution of the<br />

crowded stimulus with an irrelevant content as soon as the observer's gaze diverges from a defined<br />

location. Thus, it offers the advantage of continuous, long-lasting stimulation with a reliable control<br />

of stimulus discriminability. Taking advantage of these characteristics, several studies have<br />

established the existence of a dissociation between the subjective feeling of a jumbled,<br />

uninformative percept, and the underlying processing occuring without awareness, both at the<br />

single-feature level (e.g., line orientation, see He, Cavanagh, & Intriligator, 1996), and at the multifeature<br />

level (e.g., faces, directional arrow, Faivre & Kouider, 2011). Recently, we found that<br />

peripheral faces whose emotional features were crowded by mask patterns were processed such as<br />

to bias subsequent preference judgments (Kouider et al., 2011). Indeed, participants rated unknown<br />

Chinese pictographs as more pleasant when previously exposed to pictures and videos of happy<br />

compared to angry crowded faces. Interestingly, this influence disappeared when static and dynamic<br />

faces were presented upside-down, which is known to disrupt the processing of spatial relations<br />

between the facial features, while largely preserving local feature analysis (Rossion & Gauthier,<br />

2002). This suggests that the visual processes underlying this effect were of a configurational<br />

nature, concerning not only the features' physical properties, but also the spatial relations between<br />

them.


In the present study, we addressed two complementary issues.<br />

First, we characterized in more details the processing of facial expressions during crowding.<br />

Extending our previous results, we show that both featural crowding (i.e., induced by mask<br />

flankers) and configurational crowding (i.e., induced by neutral face flankers) preserved the<br />

nonconscious processing of configurational face information (Experiment 1). Furthermore,<br />

replicating our previous study with a neutral baseline, we show that the nonconscious preference<br />

bias measured arose specifically from the processing of static and dynamic happy faces<br />

(Experiment 2), while both happy and angry faces elicited preference biases when perceived<br />

consciously (Experiment 3).<br />

Secondly, we compared systematically the depth of facial expressions processing when stimuli were<br />

manipulated by GCC, visual masking (Experiment 4), and CFS (Experiment 5). While emotional<br />

faces under visual masking and CFS were able to elicit perceptual priming (i.e., they influenced the<br />

processing of an identical target face), we found that they were not processed up to the point of<br />

biasing preference judgment. Thus, together with the positive effects we obtained with GCC, the set<br />

of data we report provides a good example of the importance of methodological comparisons in the<br />

context of contrastive research on consciousness. The discrepancies between the different methods<br />

are discussed on the light of the neural basis of crowding, masking, and binocular rivalry.


2. Gaze-contingent crowding<br />

2.1 Experiment 1<br />

Face perception involves at least two different levels of processing. Featural processing reflects the<br />

encoding of facial parts as taken individually (e.g., the mouth, the eyes), while configurational<br />

processing reflects the encoding of the spatial relations between them (Maurer, Grand, &<br />

Mondloch, 2002). Configurational face processing is illustrated notably by the face superiority<br />

effect, in which observers discriminate a facial feature more easily if it is presented in the context of<br />

a face than if it is presented alone (Tanaka & Farah, 1993), and the face-inversion effect (Rossion &<br />

Gauthier, 2002), in which a face is more difficult to recognize when presented upside-down. In our<br />

previous study, we showed that presenting crowded emotional faces upside-down disrupted the<br />

influence they had on preference judgment, suggesting that the preference bias we observed had a<br />

configurational, rather than featural origin (Kouider, Berthet, & Faivre, 2011). Furthermore, it has<br />

been shown that the perception of a peripheral face is specifically impeded when it is flanked by<br />

other similar faces, suggesting that crowding can occur not only between the different features of<br />

faces, but also selectively between their configurational representations (Farzin, Rivera, & Whitney,<br />

2009; Louie, Bressler, & Whitney, 2007). In Experiment 1, we tested whether the nonconscious<br />

configurational processing of faces was preserved when configurational information was disrupted<br />

by crowding. For this purpose, we compared the influence on preference judgment of emotional<br />

faces surrounded by mask patterns (inducing featural crowding) and surrounded by neutral faces<br />

(inducing configurational crowding).


2.1.1 Method<br />

Participants . 18 French college students (age range = 18–35 years) participated in Experiment 1.<br />

All reported normal or corrected-to-normal vision and were paid for their participation. They were<br />

recruited in function of their inability to read Chinese pictographs.<br />

Stimuli. We recorded facial expressions from five actresses recruited from a professional acting<br />

academy. Participant's face was filmed against a black background, in an equally held illumination<br />

room. Each face expressed happiness or anger after a triggering by a mood induction strategy.<br />

Random mouse motion was used as a neutral condition. Emotional paroxysms were defined by two<br />

independent observers. Videos were slightly speeded up or down to compensate the differences<br />

between the timings of the different actors' expressions. All videos were matched for average<br />

luminance, contrast, and image size (3.2° x 3.9°), and cropped to show the face only. Snapshots<br />

were extracted from each video, at t = 0ms for the neutral expression condition, and t = 1500ms for<br />

the emotional paroxysm condition. Flankers consisted in 2.5°x2.8° masks created by overlaying<br />

faces and objects such that resulted in non-informative patterns. The luminance of the flankers was<br />

40% higher than that of the emotional faces. Targets were 3°x3° white Chinese pictographs.<br />

Equipment Eye movements were recorded monocularly with a tower mounted eye tracker (Eyelink<br />

1000 system, SR research, Ontario, Canada) controlled with the Eyelink toolbox (Cornelissen,<br />

Peters, & Palmer, 2002), with a sampling rate of 1000 Hz and a spatial resolution of 1° or above.<br />

Stimuli were all displayed by a computer running Matlab with the Psychophysics Toolbox<br />

(Brainard, 1997; Pelli, 1997) against a black background (22-in. Iiyama Vision master pro 510<br />

screen, frame rate of 85 Hz, resolution of 1024x768 pixels, luminance of 0.004 Cd.m - ²). The<br />

participant sat 57 cm from the screen in a dimly lit room, a chin and headrest was used in all<br />

experiments. A calibration phase was performed after each block of 60 trials.


Procedure.<br />

Experiment 1 consisted in 240 preference judgment trials and 120 visibility trials, equally divided in<br />

4 blocks of 120 trials. In each block, the flankers surrounding the emotional face consisted either in<br />

a circular array of 6 faces identical to the emotional face but with a neutral expression (f), or in a<br />

circular array of 6 mask patterns (m). Two counterbalanced groups of participants were defined<br />

depending on the nature of the flankers (i.e., either (m-f-m-f) or (f-m-f-m)). Each trial started with a<br />

0.5° x 0.5° fixation cross for 300 ms. The emotional face was then displayed for 2500ms,<br />

surrounded by the six flankers (18° eccentricity between the emotional face and fixation cross<br />

centered at the quarter top of the screen; 3.1° (center to center distance), or 0.3° (edge to edge<br />

distance) between the emotional face and the flankers). Importantly, as soon as a participant ceased<br />

to gaze at a fixation area consisting in a zone of 5° by 5° surrounding the fixation cross, the<br />

emotional face was substituted by the same face with a neutral expression guaranteeing that the<br />

emotional face was never processed foveally (see Figure 1). Randomly, in two out of three trials,<br />

the participant’s task was to decide whether a Chinese pictogram displayed for 150 ms at the<br />

fixation location was pleasant (right button press) or unpleasant (left button press). They were<br />

instructed not to make an aesthetic judgment, but rather follow a spontaneous intuition, and to<br />

provide an answer in less than a second. In the one out of three trials remaining, a question<br />

concerning the facial expression appeared at the fixation location instead of the Chinese pictograph.<br />

Participants could read either “Happiness?”, or “Anger?” They had to answer by pressing the right<br />

button if they thought the answer was yes, or the left button if they thought it was no. The question<br />

remained on screen until a response was provided.


Figure 1<br />

Left panel: Schematic description of the GCC procedure (Experiment 1).<br />

Each trial consisted in the presentation of a fixation cross, followed by a peripheral emotional face surrounded by<br />

flankers. Unpredictably, this was followed by a Chinese pictograph on which participants had to make an evaluative<br />

judgment (Preference Task), or by a question concerning the emotion expressed by the prime, on which participants had<br />

to answer by yes or no (Visibility Task). Experiment 1: peripheral happy or angry faces were presented statically for<br />

2500ms, surrounded by flankers consisting in masks or neutral faces. Experiment 2: peripheral happy, neutral or angry<br />

faces were presented statically or dynamically for 1200ms, surrounded by mask flankers. Experiment 3: happy, neutral<br />

or angry faces were presented foveally for 75ms or 2500ms, surrounded by mask flankers.<br />

Right panel: Schematic description of the gaze-contingent substitution. As long as participants' gaze was maintained in<br />

a 5° x 5° region surrounding the fixation cross (“correct gaze”), the peripheral emotional face was presented among the<br />

flankers. As soon as participants' gaze diverged from this region, the emotional face was replaced by the same face with<br />

a neutral expression (“gaze-contingent substitution”). In Experiment 2 which contained a neutral baseline condition, the<br />

substitution was realized with the same face with a different neutral expression.


2.1.2 Results<br />

Participants rated the target with a mean pleasant response rate of 47.45% (SD = 12.02). In order to<br />

estimate the preference bias occurring during featural and configurational crowding, we ran a 2 x 2<br />

ANOVA with valence (happy vs. angry) and flanker type (mask vs. neutral face) as within-subjects<br />

factors and group (f-m-f-m vs. m-f-m-f) as between-subjects factor. This analysis revealed a main<br />

effect of valence [F(1,17) = 9.64; p < 0.01], reflecting the fact that participants rated the target as<br />

more pleasant after being exposed to a happy compared to an angry face by 4.52%, without any<br />

interaction of valence with flanker type nor with group (both F < 1). Analysis of the facial<br />

expression visibility task revealed that participants performed at chance level both when flankers<br />

were neutral faces (mean d-prime = -0.15, t(18) = -0.73, p = 0.48) and masks (mean d-prime = 0.25,<br />

t(18) = 1.28, p = 0.22), without any difference between the two conditions (p = 0.17). In sum,<br />

Experiment 1 replicated our previous study showing that the nonconscious processing of facial<br />

expressions occurred despite featural crowding, and additionally revealed that it occurred despite<br />

configurational crowding.<br />

2.2 Experiment 2<br />

In our previous study, we found that static and dynamic facial expressions biased preference<br />

judgments to the same extent (Kouider, Berthet, & Faivre, 2011). However, it is known that when<br />

dynamic facial expressions are consciously visible, they usually induce increased emotional<br />

responses, both at the behavioral and the physiological level (Sato, Kochiyama, Yoshikawa, Naito,<br />

& Matsumura, 2004; Trautmann, Fehr, & Herrmann, 2009). In Experiment 2, we further explored<br />

this issue in several respects. First, in order to assess which emotion (i.e., happiness or anger,<br />

expressed statically or dynamically) was able to modulate preference judgments, we added a<br />

baseline condition consisting in dynamic neutral faces moving randomly the mouth, or static neutral


faces extracted from these videos (see Methods). Second, it remains possible that the finding of<br />

equivalent bias from static and dynamic stimuli in our previous study resulted from group<br />

differences (i.e., overall, groups of participants exposed to static and dynamic stimuli had different<br />

mean pleasant response rates). To rule out this possibility, Experiment 2 was based on a withinsubject<br />

design, allowing for a direct comparison between static and dynamic emotional processing<br />

through the same participants. Third, we further reduced potential differences regarding the amount<br />

of emotional information that could be extracted from static and dynamic stimuli. Indeed, in our<br />

previous study, the first 500ms of prime presentation were already at the paroxysm of emotion for<br />

static faces, while they remained neutral for dynamic faces. This resulted in a difference of roughly<br />

20 % on a total of 2500ms of emotional expression, and could explain why dynamic stimuli did not<br />

have a larger impact compared to static faces. In this new experiment, the duration of the videos<br />

was shortened to 1200ms and discrepancy between the amount of information in static and dynamic<br />

stimuli was reduced to ~8%, dynamic stimuli starting with a neutral expression (100ms), followed<br />

by emotional progression until paroxysm (1000ms), and dynamical maintenance at the peak level<br />

(100 ms).


2.2.1 Method<br />

Participants . 13 French college students (age range = 18–35 years) participated in Experiment 2.<br />

All reported normal or corrected-to-normal vision and were paid for their participation. They were<br />

recruited in function of their inability to read Chinese pictographs.<br />

Stimuli. Stimuli were similar to the ones used in Experiment 1.<br />

Procedure. Experiment 2 consisted in 360 priming trials and 120 visibility trials, equally divided in<br />

4 blocks of 120 trials. The procedure was similar to the one used in Experiment 1, except for the<br />

following points. 1. Flankers were exclusively mask patterns. 2. Each block contained exclusively<br />

either dynamic (d) or static (s) stimuli, consisting in happy, angry, or neutral faces, presented for<br />

1200ms. Two counterbalanced groups of participants were defined depending on the sequence of<br />

blocks they were assigned to (i.e., either (d-s-d-s) or (s-d-s-d)). 3. In the visibility task, participants<br />

had to answer to one of these three questions regarding the emotional face: “Happiness?”,<br />

”Neutral?”, or ”Anger?”.<br />

2.2.2 Results<br />

Modulation of the pleasant response rate in Experiment 2 was first analyzed globally in a 3<br />

(Valence; happy, neutral, angry) × 2 (Stimulus type; dynamic vs. static) ANOVA, with repeated<br />

measures on the two factors. This analysis revealed a main effect of valence [F(1,12) = 5.00; p <<br />

0.05], but no interaction with stimulus type [F(1,12) = 0.002; p = 0.96]. This confirms that<br />

nonconscious emotional processing was equally strong for static and dynamic faces. We then<br />

performed separate 2 × 2 ANOVAs to differentiate the impact of happy and angry faces. We found


that, in comparison to neutral faces, participants rated the Chinese pictographs as more pleasant<br />

when they were previously exposed to crowded happy faces [3.7%; t(12) = 2.51; SD = 5.2, p <<br />

0.05]. This nonconscious modulation was not affected by stimulus type [F(1,12) = 0.03, p = 0.87],<br />

as it was of similar amplitude for static [3.4%; t(12) = 2.05; SD = 6.03, p = 0.06] and dynamic faces<br />

[3.9%; t(12) = 1.58; SD = 8.94, p = 0.14]. However, no overall modulation was observed for angry<br />

faces [1.1%; t(12) = 0.50; SD = 7.96, p = 0.63], nor when restricting to static faces [1.4%; t(12) =<br />

0.42; SD = 12.21, p = 0.68] or dynamic faces [0.8%; t(12) = 0.32; SD = 8.62, p = 0.75] (Figure 2).<br />

Analysis of the facial expression visibility task revealed chance-level performance (mean d-prime =<br />

0.13; t(12) = 0.77; SD = 0.64, p = 0.46), without significant differences as a function of valence<br />

[F(1,12) = 1.46, p = 0.25] or stimulus type [F(1,12) = 0.78, p = 0.39]. In sum, Experiment 2<br />

revealed that the nonconscious origin of the preference bias that we obtained previously stems<br />

primarily from the processing of facial expressions conveying positive emotions, regardless of their<br />

static or dynamic properties.<br />

Figure 2. Comparative results of preference judgment in GCC (Experiment 2)<br />

Averaged percentage of pleasant response on the Chinese pictograph, depending on the emotion expressed by angry<br />

(dark gray), neutral (gray), or happy faces (light gray). Error bars denote one standard error. * denotes a p-value < 0.05.


2.3 Experiment 3<br />

Experiment 3 aimed at testing whether the restriction to positive biases we observed in Experiment<br />

2 was specific to nonconscious perceptual processes. We replicated Experiment 2 in condition of<br />

full visibility, with static emotional faces presented foveally. Furthermore, faces were presented<br />

either for a long duration (2500ms), or for a short duration (75ms), in order to control for the<br />

existence of explicit strategies when participants are exposed to long-lasting visible faces (e.g.,<br />

intentional inhibition of emotional influences). Here, we relied on the assumption that the time<br />

necessary to develop these strategies would not be sufficient in case faces are presented for 75ms<br />

and instructions impose to provide a preference judgment in less than a second.<br />

2.3.1 Method<br />

Participants . 21 French college students (age range = 18–35 years) participated in Experiment 3.<br />

All reported normal or corrected-to-normal vision and were paid for their participation. They were<br />

recruited in function of their inability to read Chinese pictographs.<br />

Stimuli. Stimuli were similar to the ones used in Experiment 1.<br />

Procedure. Experiment 3 consisted in 120 priming trials and 60 visibility trials, equally divided in<br />

3 blocks of 60 trials. The procedure was similar to the one used in Experiment 2, except for the<br />

following points: 1. All stimuli were presented at fixation position, such as participants could<br />

perceive them foveally. 2. Emotional faces were all static and they were randomly presented either<br />

for a short duration (i.e., 75ms) or for a long duration (i.e., 2500ms) within a block.


2.3.2 Results<br />

Participants rated the target with a mean pleasant response rate of 59.79% (SD = 14.18). A 3<br />

(Valence; happy, neutral, angry) × 2 (Stimulus duration; short vs. long) ANOVA revealed a main<br />

effect of valence [F(1,20) = 17.03; p < 0.001]. This reflected the fact that in comparison to a neutral<br />

face exposure, participants rated the target as more pleasant after being exposed to a happy face<br />

[10.07%; t(20) = 2.78; p < 0.05], and as less pleasant after being exposed to an angry face [-7.71%;<br />

t(20) = -2.65; p < 0.05] (Figure 3). We found no interaction of valence with stimulus duration<br />

[F(1,20) = 0.18; p = 0.67], revealing that the influence of the short-lasting and long-lasting facial<br />

expressions were similar. This result ruled-out the potential involvement of explicit strategies in the<br />

long duration condition. Analysis of the visibility task revealed a main effect of stimulus valence<br />

[F(1,20) = 24.10; p < 0.001], showing that participants discriminated more accurately happy faces<br />

(mean accuracy = 92.86%) compared to angry faces (mean accuracy = 80.24%) and to neutral<br />

expressions (mean accuracy = 66.91%). However, visibility was clearly above chance-level<br />

performance in the three conditions (all p < 0.001). Furthermore, a main effect of stimulus duration<br />

[F(1,20) = 16.38; p < 0.001] revealed a greater accuracy for long-lasting compared to short lasting<br />

stimuli (i.e., 84.13% vs 75.87%). In sum, Experiment 3 revealed that when facial expressions are<br />

consciously visible, they are able to bias preference judgments towards negativity when they<br />

represent anger, and towards positivity when they represent happiness, this effect occuring<br />

regardless of the stimulus duration.


Figure 3. Comparative results of conscious preference judgment bias (Experiment 3)<br />

Averaged percentage of pleasant response on the Chinese pictograph, depending on the emotion expressed by angry<br />

(dark gray), neutral (gray), or happy faces (light gray). Short stimulus duration and long stimulus duration conditions<br />

are averaged. Error bars denote one standard error. * denotes a p-value < 0.05.<br />

3. Comparison with Visual Masking<br />

The large majority of research on nonconscious perception has relied on the conjoint use of very<br />

brief stimulus durations (i.e., less than 50ms) and stimulus degradation through backward masking<br />

(Breitmeyer & Ögmen, 2006; Kouider & Dehaene, 2007). For instance, facial expressions presented<br />

very briefly and backward masked have been argued to affect brain regions dealing with emotional<br />

information (Morris, Ohman, & Dolan, 1998; Whalen et al., 1998). Yet, such findings have proven<br />

difficult to replicate when visibility is stringently controlled (Pessoa, 2005). Here, we relied on a<br />

recent face priming paradigm that has shown robust nonconscious influences, at least at the<br />

perceptual level, on behavioral, electrophysiological, and hemodynamic responses while carefully<br />

controlling for stimulus visibility (Henson, Mouchlianitis, Matthews, & Kouider, 2008; Kouider,<br />

Eger, Dolan, & Henson, 2009). In Experiment 4a, we adapted this masked face priming method to<br />

the preference judgment task, creating a masking equivalent to GCC. In Experiment 4b participants


had to indicate whether a target face was happy or angry, in case it was preceded by a similar<br />

masked face, and in case it was preceded by a different masked face expressing the same emotion.<br />

This repetition priming procedure aimed at controlling that masked facial expressions were<br />

processed at a perceptual level.<br />

3.1 Experiment 4<br />

3.1.1 Methods<br />

Participants. 18 French college students (age range = 18–35 years) participated in Experiment 4a,<br />

and 10 in Experiment 4b. All reported normal or corrected-to-normal vision and were paid for their<br />

participation. They were recruited in function of their inability to read Chinese pictographs.<br />

Stimuli. Emotional faces were static pictures of happy or angry expressions similar to the ones used<br />

in Experiment 1. In order to produce a robust masking effect, faces luminance was 40% lower than<br />

for the masks, and peripheral facial attributes (e.g., hair, ears) were additionally cropped. In<br />

Experiment 4a, targets were 3°x3° white Chinese pictographs. In Experiment 4b, targets were either<br />

similar to the masked face, or different faces expressing the same emotion. Targets were 110 %<br />

larger compared to the masked faces, in order to avoid physical overlap.<br />

Equipment. Stimuli were displayed on a 17-in. Compaq Trinitron P700 monitor with a frame rate<br />

of 60 Hz and a resolution of 1024x768 pixels.


Procedure.<br />

Experiment 4a consisted in 120 priming trials and 60 visibility trials. Each trial started with a 0.5° x<br />

0.5° fixation cross for 300 ms, followed by a forward mask for 500ms, the emotional face for 33ms<br />

and then a backward mask for 50ms (see Figure 4). In the preference task, a Chinese Pictograph<br />

appeared centrally for 150ms, while in the visibility task, a question regarding the facial expression<br />

remained on screen until a response was provided. Instructions were identical to those used<br />

previously in Experiment 1. Experiment 4b consisted in 160 priming trials and 60 visibility trials.<br />

Each trial started with a 0.5° x 0.5° fixation cross for 300ms. The masked faces were displayed in<br />

the very same way as in Experiment 4a. In priming trials, the task was to decide, as quickly as<br />

possible, whether an emotional target face displayed for 200 ms at the fixation location expressed<br />

anger or happiness. Participants indicated their response with their left index finger if they thought<br />

the face was angry or right index finger if they thought it was happy. They were told to answer as<br />

fast as possible. For visibility trials, here also, a question concerning the masked face appeared at<br />

the fixation location instead of the target face. Participants could read either “Happiness?” or<br />

“Anger?”. They had to answer by pressing the right button if they thought the answer was yes, or<br />

with the left button if they thought it was no. The occurrence of a visibility task was chosen<br />

randomly at each trial.


Figure 4. Schematic description of the masking procedure (Experiment 4a). Each trial consisted in the presentation of a<br />

fixation cross, followed immediately by a forward mask pattern, and then by the emotional face accompanied by the<br />

backward mask pattern. This was followed by a Chinese pictograph (Preference Task), or a question concerning the<br />

emotion expressed by the face (Visibility Task). Experiment 4b had the very same procedure, except that the preference<br />

task was replaced by a perceptual priming task, in which the target was a face either identical, either expressing the<br />

same emotion than the masked face.<br />

3.1.2 Results<br />

In Experiment 4a, we failed to observe any significant preference bias of happy compared to angry<br />

masked faces [2.5 %; t(18) = 1.22, p = 0.24] (see Table 1). Importantly, however, the repetition<br />

priming experiment (Experiment 4b), controlling that the emotional faces were processed at<br />

perceptual levels, revealed a significant effect of priming [8 ms; t(10) = 2.15; p < 0.05] (see Table 2)<br />

In both experiments, the visibility task confirmed that backward masking prevented conscious<br />

access to the facial expressions, as performance was at chance for both Experiment 4a ( mean d-<br />

prime = -0.05; t(18) = -0.67; SD = 0.3, p = 0.51) and Experiment 4b ( mean d-prime = 0.11; t(10) =<br />

0.32; SD = 1.15, p = 0.75). In sum, these results suggest that the strong stimulus degradation<br />

through masking still allows for the extraction of perceptual information but prevents the processing<br />

of emotional contents.


4. Comparison with continuous flash suppression (CFS)<br />

Another alternative that has recently attracted attention is continuous flash suppression (CFS, see<br />

Tsuchiya & Koch, 2005). This technique, which is an extension of binocular rivalry, consists in<br />

presenting one eye with a dynamic stream of contour-rich, high-contrast patterns, in order to<br />

suppress from awareness the stimulus in the other eye. As in GCC, this method has the advantage of<br />

allowing for long stimulus durations, thus potentially increasing the strength of invisible signals.<br />

However, in CFS, the largest suppression appears to occur relatively early in the visual system (i.e.,<br />

in sub-cortical and striate areas), and might thus reduce the possibility of processing in visual<br />

ventral areas dealing with object and face recognition (Lin & He, 2008). Here, we tested whether<br />

static facial expressions manipulated by CFS could bias preference judgments (Experiment 5a) and<br />

elicit repetition priming (Experiment 5b). In Experiment 5c, we extended the measure of preference<br />

judgment bias to dynamic facial expressions.<br />

4.1 Experiment 5<br />

4.1.1 Method<br />

Participants. 15 French college students (age range = 18–35 years) participated in Experiment 5a,<br />

9 in Experiment 5b, and 12 in Experiment 5c. All reported normal or corrected-to-normal vision and<br />

were paid for their participation. They were recruited in function of their inability to read Chinese<br />

pictographs.<br />

Stimuli. Static stimuli in Experiment 5a & 5b were similar to those used in the static condition of<br />

Experiment 1. Dynamic stimuli in Experiment 5c were similar to those used in the dynamic<br />

condition of Experiment 2.


Equipment. Observers viewed the display through an adjustable mirror stereoscope (ScreenScope<br />

Mirror Stereoscope) on a 17-in. Compaq Trinitron P700 monitor with a frame rate of 60 Hz and a<br />

resolution of 1024x768 pixels.<br />

Procedure. A 8.7 x 6.7° frame, composed of textured black and white bars (0.7° width) was<br />

presented in each eye to facilitate stable convergence of the two images. Mondrian patterns<br />

consisted of arrays of randomly generated shapes of rapidly changing color and form (i.e., every<br />

125ms, 8Hz), circumscribed by an outer square border corresponding to the surface of stimuli<br />

presentation (8° x 6°), and presented to left or right eye (“non suppressed eye”, randomly chosen at<br />

each trial). Emotional faces were displayed for 2500ms, either statically (Experiments 5a & 5b) or<br />

dynamically (Experiment 5c) (see Figure 5). In order to maintain the suppressed faces invisible,<br />

their luminance was decreased by a factor of 70% compared to the targets. Targets were 110 %<br />

larger compared to the suppressed faces, in order to avoid physical overlap.<br />

Preference bias experiments (Experiments 5a & 5c) consisted in 120 priming trials and 60 visibility<br />

trials. The preference valence task and the visibility task were similar to those used previously in<br />

Experiment 1. The occurrence of a visibility task was chosen randomly at each trial. The perceptual<br />

priming experiment (Experiment 5b) consisted in 160 priming trials and 60 visibility trials. Targets<br />

were either similar to the suppressed emotional face, or different faces expressing the same<br />

emotion. The perceptual priming task and the visibility task were similar to those used previously in<br />

Experiment 4b. For each trial, all faces were always displayed in the same eye. The occurrence of a<br />

visibility task was chosen randomly at each trial.


Figure 5. Schematic description of the CFS procedure (Experiment 5a)<br />

Each trial consisted in the presentation of a fixation cross, followed by a dynamic stream of alternating patterns<br />

(Mondrian) displayed in one eye, while the static emotional face was presented in the other (suppressed eye). When the<br />

Mondrian stream stopped, either a Chinese pictograph (Preference Task) or a question concerning the emotion<br />

expressed by the face (Visbility Task) appeared in the suppressed eye. Experiment 5b followed the very same design,<br />

except that the preference task was replaced by a perceptual priming task, in which the target was a face either identical,<br />

either expressing the same emotion than the suppressed face. Experiment 5c was the equivalent of Experiment 5a with<br />

dynamic faces.<br />

4.1.2 Results<br />

In Experiment 5a, in which the suppressed faces were presented statically for 2500ms and followed<br />

by the same neutral Chinese pictographs as in the preceding experiments, we failed to observe a<br />

significant influence of the facial expressions on preference judgment [0.6 %; t(14) = 0.24; p =<br />

0.82] (see Table 1). However, in a control experiment (Experiment 5b) in which the suppressed<br />

faces were followed by either same or different faces in order to assess perceptual processing, we<br />

observed a significant effect of repetition priming [-18 ms; t(8) = -2.56, p < 0.05] (see Table 2). It is<br />

of note that the modulation for repetition priming was negative here (longer reaction times in<br />

repeated compared to unrelated trials). This is congruent with other studies by our group showing<br />

that this actually reflects the use of prolonged stimulus exposure in CFS (Barbot & Kouider,


submitted) or in crowding (Faivre & Kouider, submitted). Indeed, we recently found that while<br />

short stimulus exposures (e.g., 200ms) lead to positive repetition priming, longer exposures (e.g.,<br />

1000ms) actually induce negative priming. This reverse of priming effects might be related to the<br />

fact that visual stimulation in the absence of perceptual awareness does not allow for a sustained<br />

representation of the encoded features and result in sensory habituation.<br />

Stimulus visibility was here also not significantly better than chance in both Experiment 5a ( mean<br />

d-prime = 0.15; t(14) = 1.98; SD = 0.29, p = 0.07) and Experiment 5b ( mean d-prime = 0.09; t(8) =<br />

1.35; SD = 0.20, p = 0.21). Notably, there was a marginal trend for visibility in Experiment 5a,<br />

which could indicate that some participants might have been aware of the facial expressions. In<br />

order to address with this possibility, we relied again on Greenwald’s regression method<br />

(Greenwald, Klinger, & Schuh, 1995) which revealed that priming extrapolated to null visibility<br />

clearly did not differ from zero (intercept = -1%, p = 0.74).<br />

Finally, in Experiment 5c, we tested whether dynamic stimuli might be more successful at inducing<br />

emotional influences in CFS. Yet, here also, no preference bias was found [-1,1%; t(11) = -0.5; p =<br />

0.63], with chance-level performance on the visibility task ( mean d-prime = 0.19; SD = 0.48, p =<br />

0.19). In sum, our results reveal that, as with masking, perceptual information from stimuli<br />

manipulated with CFS are extracted and are able to influence subsequent perception (i.e., perceptual<br />

priming), but do not reach the level necessary to bias subsequent decisions (i.e., preference<br />

judgments).


Table 1. Comparative results of preference judgment in masking and CFS.<br />

Averaged percentage of pleasant response rate on the neutral target (Chinese pictograph), depending on the emotion<br />

expressed by the face (i.e., happiness or anger). SD denotes standard deviation. Results are shown for masking<br />

(Experiment 4a), CFS with static faces (Experiment 5a), and CFS with dynamic faces (Experiment 5c).<br />

Table 2. Perceptual priming results in masking and CFS.<br />

Averaged reaction times for the emotional target face, for related and unrelated trials. Results are shown for Experiment<br />

4b (masking) and Experiment 5b (CFS). SD denotes standard deviation.


6. Discussion<br />

With a series of 7 experiments, we probed the depth of processing of faces maintained outside<br />

perceptual awareness through three different techniques: gaze-contingent crowding (GCC), visual<br />

masking, and continuous flash suppression (CFS). This comparative approach not only provides<br />

further evidence regarding the nonconscious processing of emotional faces (see Tamietto et de<br />

Gelder, 2010, for a review), but it also offers an interesting point of view regarding the development<br />

of probes for nonconscious cognition.<br />

First, we showed with GCC that peripheral stimuli conveying emotions (i.e., happy compared to<br />

angry faces) could bias subsequent preference judgments, both when featural and configurational<br />

information were disrupted by crowding. In a second experiment which included a neutral baseline,<br />

we showed that this approach could be applied as well to dynamic stimuli (videos), and that the<br />

preference bias arose specifically from faces expressing happiness. This restriction to positive<br />

preference bias was not observed when facial expressions where presented foveally and were thus<br />

consciously visible, suggesting that featural crowding disrupted the physical information involved<br />

in anger expression. This is corroborated with previous results showing that peripheral presentation<br />

of faces globally impairs expression recognition, except in the case of happiness (Goren & Wilson,<br />

2006). This might be related to the fact that diagnostic features for the recognition of happiness<br />

involve mainly the mouth in the low spatial frequency spectrum, while the recognition of anger is<br />

rather driven by the eyes (i.e., frown) through higher spatial frequencies (Smith & Schyns, 2009).<br />

The precise role of facial features and spatial frequency during the processing of crowded faces<br />

remain to be investigated.<br />

<strong>These</strong> findings have implications regarding the phenomenon of crowding itself, whose origins<br />

remain highly controversial (Levi, 2008). Crowding occurs when an object and its flankers are


integrated into the same integration field, resulting in a jumbled percept in which the object cannot<br />

be discriminated. It has been shown that the size of the integration field increased with eccentricity<br />

in the visual field, in line with an empirical psychophysical law (Bouma law, Bouma, 1970).<br />

However, the reason for this widening remains highly debated. According to bottom-up proposals,<br />

integration fields are materialized in the primary visual cortex (Pelli, 2008), which consequently<br />

implies a loss of information for crowded stimuli at and beyond V1. Our results tend to argue<br />

against this view, and rather suggest that the information from crowded stimuli is still present in the<br />

visual system, but remains inaccessible to conscious awareness. From this perspective, crowded<br />

perception would only reflect a partial conscious read-out of information, while further processing<br />

occurs in a nonconscious manner. Consistent with a belated occurrence of crowding along the visual<br />

pathways, several studies have shown that single-feature crowded stimuli (e.g., line orientation, see<br />

He et al., 1996; Montaser-Kouhsari & Rajimehr, 2005) and multifeature crowded objects (e.g., faces<br />

or directionnal arrows, see Faivre & Kouider, 2011) are processed despite the fact that they remain<br />

undiscriminable consciously. In other terms, during featural crowding, a feature is processed<br />

nonconsciously despite featural interactions with the flankers. In our previous study, we found that<br />

the preference bias depended on a configurational processing of crowded faces, since the effect<br />

disappeared when the crowded faces were presented upside-down (Kouider, Berthet, & Faivre,<br />

2011). Here, in Experiment 1, we found that configurational crowding (i.e., induced by face<br />

flankers which interfere with the crowded face at the configurational level) did not disrupt the bias<br />

on preference judgment. In other terms, we show that crowding allows for a nonconscious<br />

configurational face processing despite configurational interactions with the flankers.<br />

In Experiment 2, we found that GCC could be used to demonstrate influences from happiness<br />

emotions as expressed statically (i.e., in pictures) as well as dynamically (i.e., in videos). It is of<br />

note that the amplitude of preference bias was similar in the static and dynamic conditions.<br />

However, it is known that when they are visible, facial expressions are better recognized in their


dynamic compared to their static form. Clearly, it remains possible that the behavioral measure we<br />

employed is not sensitive enough to highlight superiority of invisible dynamic expressions on<br />

preference judgment. Yet, these results question the capacity for the visual system to bind across<br />

time invisible facial features into a perceptual representation. To that respect, GCC allows for the<br />

study of nonconscious temporal integration, a fundamental property that has not been investigated<br />

so far.<br />

When using the same stimuli as in the GCC experiments, but suppressing them from awareness by<br />

visual masking or CFS, no influence on preference judgments could be highlighted. Nevertheless,<br />

we found lower-level perceptual priming effects revealed by a modulation of reaction times on a<br />

repetition priming task. It is of note that similar effects were previously obtained with GCC (Faivre<br />

& Kouider, 2011). The fragility of emotional influences observed in masking paradigms could be<br />

related to the strong degradation of visual stimuli, since masking is known to disrupt the reentrant<br />

activity associated with higher-level visual processes (Lamme & Roelfsema, 2000). The results we<br />

found in Experiment 4a and 4b are consistent with previous rigorous analyzes (Pessoa, 2005), and<br />

question the existence of emotional faces processing above perceptual levels. The drastic<br />

degradation required by masking in order to prevent awareness might dramatically reduce stimulus<br />

strength, so that the masked stimulus might not reach the level of processing necessary for valence<br />

extraction.<br />

Concerning CFS, the results found in Experiment 3 are coherent with findings revealing that during<br />

binocular rivalry drastic suppression actually occurs relatively early in the visual system (i.e., in<br />

sub-cortical and striate areas), impeding the processing in higher visual regions of the ventral<br />

stream (Fang & He, 2005, Jiang & He, 2006). Along the same lines, it has recently been shown<br />

using CFS that while categorically congruent suppressed stimuli can facilitate the categorization of<br />

tools (assumed to be processed in the dorsal visual pathway), these stimuli have no effect on non


manipulable objects that are assumed to be processed in the ventral visual pathway (Almeida et al.,<br />

2008).<br />

However, the positive results we obtained with GCC suggest that these negative results with<br />

masking and CFS do not reflect a theoretical limitation of nonconscious cognition, but rather a<br />

methodological one. In this respect, the set of data we report provides a good example of the<br />

importance of methodological comparisons in the context of a contrastive study of consciousness.<br />

One possible reason why crowding paradigms appear to lead to stronger nonconscious influences<br />

than masking and CFS is its ecological relevance. Indeed, bombarding the eyes with flashes or<br />

backward masks is likely to be confined to laboratory contexts. By contrast, crowding occurs<br />

permanently in our perceptual environment and the visual system might have been optimally tuned<br />

for processing peripheral stimuli. By showing high-level nonconscious effects that arise from<br />

crowded stimuli, we think that GCC consists in a valuable alternative to probe nonconscious<br />

cognition. While crowding is considered as a bottleneck to object recognition (Whitney & Levi,<br />

2011), the amount of environmental information that can be accessed consciously is thus reduced,<br />

but at the same time the informational encoding that is necessary for nonconscious behavioral<br />

responses seems to be preserved.


Almeida, J., Mahon, B. Z., Nakayama, K., & Caramazza, A. (2008). Unconscious processing<br />

dissociates along categorical lines. Proceedings of the National Academy of Sciences of the<br />

United States of America, 105(39), 15214–15218. doi:10.1073/pnas.0805867105<br />

Baars, B. (1997). Contrastive phenomenology: A thoroughly empirical approach to consciousness.<br />

The Nature of Consciousness. MIT Press.<br />

Bouma, H. (1970). Interaction effects in parafoveal letter recognition. Nature, 226(5241), 177–178.<br />

Brainard, D. H. (1997). The Psychophysics Toolbox. Spatial Vision, 10(4), 433–436.<br />

Breitmeyer, B. G., & Ögmen, H. (2006). Visual masking: time slices through conscious and<br />

unconscious vision. Oxford University Press.<br />

Cornelissen, F. W., Peters, E. M., & Palmer, J. (2002). The Eyelink Toolbox: eye tracking with<br />

MATLAB and the Psychophysics Toolbox. Behavior Research Methods, Instruments, &<br />

Computers: A Journal of the Psychonomic Society, Inc, 34(4), 613–617.<br />

Faivre, N., & Kouider, S. (2011). Multi-feature objects elicit nonconscious priming despite<br />

crowding. Journal of Vision, 11(3). doi:10.1167/11.3.2<br />

Fang, F., & He, S. (2005). Cortical responses to invisible objects in the human dorsal and ventral<br />

pathways. Nature Neuroscience, 8(10), 1380-1385. doi:10.1038/nn1537<br />

Farzin, F., Rivera, S. M., & Whitney, D. (2009). Holistic crowding of Mooney faces. Journal of<br />

Vision, 9(6), 18.1-15. doi:10.1167/9.6.18<br />

Goren, D., & Wilson, H. R. (2006). Quantifying facial expression recognition across viewing<br />

conditions. Vision Research, 46(8-9), 1253-1262. doi:10.1016/j.visres.2005.10.028<br />

Greenwald, A. G., Klinger, M. R., & Schuh, E. S. (1995). Activation by marginally perceptible<br />

(“subliminal”) stimuli: dissociation of unconscious from conscious cognition. Journal of<br />

Experimental Psychology. General, 124(1), 22-42.<br />

Henson, R N, Mouchlianitis, E., Matthews, W. J., & Kouider, S. (2008). Electrophysiological<br />

correlates of masked face priming. NeuroImage, 40(2), 884–895.<br />

He, S., Cavanagh, P., & Intriligator, J. (1996). Attentional resolution and the locus of visual<br />

awareness. Nature, 383(6598), 334–337. doi:10.1038/383334a0<br />

Jiang Y, & He, S. Cortical responses to invisible faces: dissociating subsystems for facialinformation<br />

processing. Current Biology. 16(20):2023-9.<br />

Kim, C. Y., & Blake, R. (2005). Psychophysical magic: rendering the visible invisible. Trends in


Cognitive Sciences, 9(8), 381–388.<br />

Kooi, F. L., Toet, A., Tripathy, S. P., & Levi, D. M. (1994). The effect of similarity and duration on<br />

spatial interaction in peripheral vision. Spatial Vision, 8, 255–279.<br />

Kouider, & Dehaene. (2007). Levels of processing during non-conscious perception: a critical<br />

review of visual masking. Philosophical Transactions of the Royal Society of London. Series<br />

B, Biological Sciences, 362(1481), 857–875. doi:10.1098/rstb.2007.2093<br />

Kouider, S., Berthet, V., & Faivre, N. (2011). Preference is biased by crowded facial expressions.<br />

Psychological Science, 22(2), 184-189. doi:10.1177/0956797610396226<br />

Kouider, S., Eger, E., Dolan, R., & Henson, R. N. (2009). Activity in face-responsive brain regions<br />

is modulated by invisible, attended faces: evidence from masked priming. Cerebral Cortex<br />

(New York, N.Y.: 1991), 19(1), 13–23. doi:10.1093/cercor/bhn048<br />

Lamme, V. A., & Roelfsema, P. R. (2000). The distinct modes of vision offered by feedforward and<br />

recurrent processing. Trends in Neurosciences, 23(11), 571-579.<br />

Levi, D. M. (2008). Crowding–an essential bottleneck for object recognition: a mini-review. Vision<br />

Research, 48(5), 635–654. doi:10.1016/j.visres.2007.12.009<br />

Lin, Z., & He, S. (2009). Seeing the invisible: the scope and limits of unconscious processing in<br />

binocular rivalry. Progress in Neurobiology, 87(4), 195–211.<br />

Di Lollo, V., Enns, J. T., & Rensink, R. A. (2000). Competition for consciousness among visual<br />

events: The psychophysics of reentrant visual processes. Journal of Experimental<br />

Psychology: General, 129(4), 481-507. doi:10.1037/0096-3445.129.4.481<br />

Louie, E. G., Bressler, D. W., & Whitney, D. (2007). Holistic crowding: Selective interference<br />

between configural representations of faces in crowded scenes. Journal of Vision, 7(2), 24.<br />

Marcel, A. J. 1983 Conscious and unconscious perception: experiments on visual masking and word<br />

recognition. Cogn. Psychol. 15, 197–237. (doi:10.1016/0010-0285(83) 90009-9)<br />

Maurer, D., Grand, R. L., & Mondloch, C. J. (2002). The many faces of configural processing.<br />

Trends in Cognitive Sciences, 6(6), 255-260. doi:10.1016/S1364-6613(02)01903-4<br />

Montaser-Kouhsari, L., & Rajimehr, R. (2005). Subliminal attentional modulation in crowding<br />

condition. Vision Research, 45(7), 839–844.<br />

Morris, J. S., Ohman, A., & Dolan, R. J. (1998). Conscious and unconscious emotional learning in<br />

the human amygdala. Nature, 393(6684), 467-470. doi:10.1038/30976


Pelli. (1997). The VideoToolbox software for visual psychophysics: transforming numbers into<br />

movies. Spatial Vision, 10(4), 437–442.<br />

Pelli, D. G. (2008). Crowding: a cortical constraint on object recognition. Curr Opin Neurobiol,<br />

18(4), 445–451. doi:10.1016/j.conb.2008.09.008<br />

Pessoa, L. (2005). To what extent are emotional visual stimuli processed without attention and<br />

awareness? Current Opinion in Neurobiology, 15(2), 188–196.<br />

doi:10.1016/j.conb.2005.03.002<br />

Rossion, B., & Gauthier, I. (2002). How does the brain process upright and inverted faces?<br />

Behavioral and Cognitive Neuroscience Reviews, 1(1), 63-75.<br />

Sato, W., Kochiyama, T., Yoshikawa, S., Naito, E., & Matsumura, M. (2004). Enhanced neural<br />

activity in response to dynamic facial expressions of emotion: an fMRI study. Brain Res<br />

Cogn Brain Res, 20(1), 81–91. doi:10.1016/j.cogbrainres.2004.01.008<br />

Smith F. W., & Schyns P. G. Smile through your fear and sadness: transmitting and identifying<br />

facial expression signals over a range of viewing distances. Psychological Science.<br />

20(10):1202-8.<br />

Tamietto, M., & Gelder, B. de. (2010). Neural bases of the non-conscious perception of emotional<br />

signals. Nat Rev Neurosci, 11(10), 697–709. doi:10.1038/nrn2889<br />

Tanaka, J. W., & Farah, M. J. (1993). Parts and wholes in face recognition. The Quarterly Journal<br />

of Experimental Psychology. A, Human Experimental Psychology, 46(2), 225-245.<br />

Trautmann, S. A., Fehr, T., & Herrmann, M. (2009). Emotions in motion: Dynamic compared to<br />

static facial expressions of disgust and happiness reveal more widespread emotion-specific<br />

activations. Brain Research, 1284, 100–115. doi:10.1016/j.brainres.2009.05.075<br />

Tsuchiya, N., & Koch, C. (2005). Continuous flash suppression reduces negative afterimages.<br />

Nature neuroscience, 8(8), 1096–1101.<br />

Whalen, P. J., Rauch, S. L., Etcoff, N. L., McInerney, S. C., Lee, M. B., & Jenike, M. A. (1998).<br />

Masked presentations of emotional facial expressions modulate amygdala activity without<br />

explicit knowledge. The Journal of Neuroscience: The Official Journal of the Society for<br />

Neuroscience, 18(1), 411–418.<br />

Whitney, D., & Levi, D. M. Visual crowding: a fundamental limit on conscious perception and<br />

object recognition. Trends in Cognitive Sciences, 15(4), 160-168. 10.1016/j.tics.2011.02.005


4 Bases neurales du traitement non<br />

conscient d’expressions faciales<br />

Faivre, N., Charron, S., Roux, P., Lehéricy, S., & Kouider, S. (under review).<br />

Nonconscious Emotional Processing of Pictures and Videos Involve Distinct<br />

Neural Pathways. Neuroimage.<br />

4.1 Présentation de l’étude<br />

Introduction<br />

Cette étude de neuroimagerie clôt le groupe d’expériences visant à mieux comprendre<br />

le traitement émotionnel de visages encombrés statiques et dynamiques. A l’aide d’un<br />

paradigme en GCC adapté aux mesures en IRMf, nous avons comparé l’activité neurale<br />

induite par des expressions faciales joyeuses et neutres, sous leur forme statique et<br />

dynamique. En comptant sur la sensibilité des mesures en IRMf, nous avons cherché à<br />

mettre en évidence au niveau neural les différences potentielles existant entre le traitement<br />

non conscient de stimuli statiques et dynamiques, les mesures comportementales<br />

réalisées auparavant ne nous ayant pas permis d’y parvenir.<br />

Nous avons suivi pour cela une stratégie d’analyse en cerveau entier, mais aussi en région<br />

d’intérêts, cette dernière étant conduite par des hypothèses venues de la littérature<br />

(notamment l’implication de l’amygdale pour le traitement émotionnel non conscient,<br />

voir Tamietto & de Gelder, 2010, pour une revue de la littérature), et par la localisation<br />

fonctionnelle individuelle et indépendante des régions impliquées dans le traitement des<br />

visages (notamment l’aire fusiforme des visages, ou FFA, voir Kanwisher & Yovel, 2006,<br />

pour une revue de la littérature). Enfin, une analyse d’interaction psychophysiologique<br />

(PPI, voir Friston et al., 1997) nous a permis d’estimer la connectivité fonctionnelle d’une<br />

partie du réseau cérébral mise en évidence en premier lieu par les contrastes linéaires.<br />

113


CHAPITRE 4.<br />

BASES NEURALES DU TRAITEMENT NON CONSCIENT D’EXPRESSIONS FACIALES<br />

Principaux résultats<br />

Au niveau comportemental, nous avons une fois de plus répliqué le résultat montrant<br />

qu’en comparaison aux visages neutres, les visages exprimant la joie induisait un biais<br />

de préférence positif lors du jugement d’une cible abstraite, et ce de manière équivalente<br />

pour les expressions statiques et dynamiques. Au niveau neural, nous avons trouvé un<br />

pattern d’activité différent en fonction du caractère statique ou dynamique des expressions<br />

faciales.<br />

Pour les visages statiques, le contraste entre les expressions joyeuses et neutres a révélé<br />

un vaste réseau à la fois sous-cortical, avec notamment la mise en jeu de l’amygdale<br />

et de l’hippocampe, et cortical, avec la mise en jeu des cortex fusiformes, temporaux<br />

inférieurs, orbitofrontaux, et cingulaires antérieurs. En se basant sur les résultats fournis<br />

par la localisation fonctionnelle de la FFA, nous avons trouvé que cette dernière était<br />

également activée de manière bilatérale par le traitement non conscient des expressions<br />

faciales statiques. De plus, l’activité au sein de la FFA corrélait avec l’amplitude du<br />

biais de préférence, ce qui témoigne de son implication dans la tâche cognitive demandée<br />

aux participants. Enfin, les analyses en PPI ont révélé une connectivité fonctionnelle<br />

ipsilatérale entre les deux FFA et les deux amygdales.<br />

Pour les visages dynamiques, le même contraste entre les expressions joyeuses et neutres<br />

a révélé un réseau d’activation en partie différent. Au niveau sous-cortical, les activations<br />

concernaient l’hippocampe mais aussi la substantia innominata. Au niveau cortical, les<br />

activations concernaient principalement les cortex pariétaux postérieurs et orbitofrontaux.<br />

L’analyse en région d’intérêt n’a pas révélé l’implication de la FFA, ni son interaction<br />

avec l’amygdale.<br />

Discussion<br />

Nos résultats montrent l’existence de deux patterns d’activations cérébrales en fonction<br />

du caractère statique ou dynamique de l’expression faciale biaisant le jugement de préférence.<br />

Au niveau sous-cortical, les expressions statiques impliquaient l’amygdale, une<br />

région abondamment décrite comme faisant partie du réseau du traitement émotionnel à<br />

la fois conscient et non conscient (Whalen et al., 1998; Morris et al., 1999). Les expressions<br />

dynamiques activaient quant à elles la substantia innominata, un noyau dorsal du<br />

complexe amygdaloïde impliqué dans le traitement de l’intensité émotionnelle (arousal)<br />

plutôt que de la valence (Breiter et al., 1996; Kim et al., 2003).<br />

114


CHAPITRE 4.<br />

BASES NEURALES DU TRAITEMENT NON CONSCIENT D’EXPRESSIONS FACIALES<br />

Au niveau cortical, nous avons proposé que les expressions statiques étaient traitées le<br />

long de la voie visuelle ventrale et notamment la FFA. Rappelons que le contraste employé<br />

dans nos analyses comparait un visage émotionnel à un visage neutre, et non pas un visage<br />

à un objet comme c’est souvent le cas pour montrer l’implication des régions spécifiques<br />

au traitement des visages. Or, deux des modèles influents de perception des visages (Bruce<br />

& Young, 1986; Haxby et al., 2000) distinguent le traitement d’informations faciales<br />

invariantes comme l’identité, impliquant le cortex fusiforme et en particulier la FFA,<br />

et le traitement d’informations faciales changeantes comme les émotions, impliquant le<br />

sulcus temporal supérieur (STS). Bien qu’informative, cette distinction n’est pas absolue<br />

puisqu’en plus de nos résultats, l’implication de la FFA dans le traitement émotionnel<br />

conscient a déjà été rapportée (Vuilleumier et al., 2001; Ganel et al., 2005).<br />

En ce qui concerne les expressions dynamiques, nous avons proposé qu’elles étaient traitées<br />

le long de la voie visuelle dorsale, et notamment le cortex pariétal postérieur. Un<br />

modèle de reconnaissance des mouvements biologiques (Giese & Poggio, 2003) stipule<br />

que l’information de forme (ici les traits émotionnels du visage) est encodée au sein de la<br />

voie ventrale, alors que l’information de flux (l’évolution des traits émotionnels au cours<br />

du temps) est encodée au sein de la voie dorsale. Le fait que les expressions dynamiques<br />

encombrées n’activent pas la voie visuelle ventrale questionne la possibilité d’intégrer<br />

sans accès conscient l’information de forme et l’information de flux. Nous reviendrons<br />

sur cette notion dans la discussion.<br />

De plus, le doute demeure quant à savoir si le traitement visuel est d’abord opéré par les<br />

régions sous-corticales, puis gagne le cortex à posteriori sans passer par les aires visuelles<br />

précoces (empruntant alors la voie émotionnelle dite courte), ou si les stimuli empruntent<br />

d’abord les régions visuelles corticales ventrales et dorsales, puis respectivement l’amygdale<br />

et la substantia innominata (empruntant alors la voie émotionnelle dite longue).<br />

Cette question fait référence à un débat récent entre Tamietto & de Gelder (2010) d’une<br />

part, argumentant pour la voie visuelle courte, et Pessoa & Adolphs (2010) d’autre part,<br />

en faveur d’un modèle impliquant des vagues multiples d’activations entre voie courte<br />

et voie longue. Les résultats de connectivité fonctionnelle que nous rapportons indiquent<br />

que l’amygdale et la FFA ne sont pas simplement co-activées, mais interagissent lors du<br />

traitement d’expressions faciales statiques. En revanche, puisqu’ils ne donnent pas d’information<br />

sur la directionnalité de la connexion, ces résultats ne permettent pas de préciser<br />

le trajet de l’information. Des analyses futures de connectivité effective (directionnelle)<br />

utilisant la modélisation dynamique causale pourront faire progresser le débat (Friston<br />

et al., 2003). En revanche, une réponse partielle à la question provient de notre étude<br />

115


CHAPITRE 4.<br />

BASES NEURALES DU TRAITEMENT NON CONSCIENT D’EXPRESSIONS FACIALES<br />

comportementale du chapitre 2, montrant que le biais de préférence disparaît lorsque<br />

les visages émotionnels sont présentés de manière inversée. Ce résultat comportemental<br />

suggère le traitement configural des visages encombrés, qui, d’un point de vue neural,<br />

emprunte diverses régions de la voie visuelle ventrale (voir par exemple Haxby et al.,<br />

1999; Leube et al., 2003; Yovel & Kanwisher, 2005; Rossion et al., 2011). Si cela suggère<br />

que les expressions faciales encombrées sont en premier lieu traitées de manière corticale,<br />

et empruntent donc la voie émotionnelle longue, l’affirmation de cette hypothèse nécessitera<br />

la comparaison directe des activités cérébrales induites par des visages encombrés<br />

présentés à l’endroit et de manière inversée.<br />

Enfin, les expressions faciales statiques et dynamiques activaient également des régions<br />

communes, à savoir l’hippocampe au niveau sous-cortical, et le cortex orbitofrontal au<br />

niveau cortical. Nous avons donc proposé deux mécanismes non exclusifs suggérant que<br />

ces activations communes sous-tendaient le biais commun qu’exerçaient les expressions<br />

faciales encombrées. L’hippocampe encoderait l’évaluation contextuelle des stimuli émotionnels<br />

et leurs liens avec le jugement de préférence subséquent (Morris et al., 1999). Le<br />

cortex orbitofrontal, qui comprend des neurones répondants aux visages (Thorpe et al.,<br />

1983), modulerait lui les préférences esthétiques implicites de la cible, en fonction des<br />

afférences émotionnelles qu’il reçoit (Kawabata & Zeki, 2004).<br />

4.2 Article<br />

116


Nonconscious Emotional Processing of Pictures and Videos<br />

Involve Distinct Neural Pathways<br />

Nathan Faivre 1 , Sylvain Charron 1 , Paul Roux 1 , Stéphane Lehéricy 2 , & Sid Kouider 1<br />

1. Laboratoire de Sciences Cognitives et Psycholinguistique, CNRS/EHESS/DEC-ENS, Paris, France.<br />

2 Centre de NeuroImagerie de Recherche – CENIR, Centre de Recherche de l'Institut du Cerveau et de la Moelle<br />

epiniere, Université Pierre et Marie Curie-Paris 6 UMR-S975, Inserm U975, CNRS UMR7225, Groupe Hospitalier<br />

Pitié-Salpêtrière, Paris, France<br />

Send correspondance to: Nathan Faivre, LSCP, Ecole Normale Supérieure, 29 rue d'Ulm, 75005<br />

Paris, France. Phone: +33 1 44 32 26 25. E-mail: nathan.faivre@ens.fr<br />

Keywords: Emotion, awareness, Functional MRI, PPI, FFA, Amygdala,


Abstract.<br />

Facial expressions are known to impact observers' behavior, even when they are not consciously<br />

identifiable. Relying on visual crowding, a perceptual phenomenon whereby peripheral faces<br />

become undiscriminable, we show that participants exposed to happy vs. neutral crowded faces<br />

rated the pleasantness of a subsequent neutral target accordingly to the facial expression's valence.<br />

Using functionnal magnetic resonnance imaging (fMRI) along with psychophysiological interaction<br />

analysis, we investigated the neural determinants of this nonconscious preference bias, either<br />

induced by static (i.e., pictures) or dynamic (i.e., videos) facial expressions. We found that while<br />

static expressions activated primarily the ventral visual pathway, with notably task-related<br />

functional connectivity between the fusiform face area and the amygdala, dynamic expressions<br />

triggered the dorsal visual pathway (i.e., posterior partietal cortex) and the substantia innominata, a<br />

structure that is contiguous with the dorsal amygdala. While temporal cues are known to improve<br />

the processing of visible facial expressions, the absence of ventral activation we observed with<br />

crowded videos questions the capacity to integrate facial features and facial motions without<br />

awareness. Nevertheless, both static and dynamic facial expressions activated the hippocampus and<br />

the orbitofrontal cortex, suggesting that nonconscious preference judgements may arise,<br />

respectively, from the evaluation of emotional context and the computation of aesthetic evaluation.


Introduction<br />

Humans constantly react to faces conveying emotional cues, be they visible or not (Tamietto<br />

& de Gelder, 2010). Indeed, facial expressions are encoded even when faces are rendered invisible<br />

by visual masking or binocular rivalry (Kim & Blake, 2005). Invisible facial expressions trigger<br />

emotional reactions that are reflected, peripherally, in the form of increased skin conductance<br />

(Esteves, 1994; Williams, et al., 2004) or mimetic facial muscles activity (Killgore & Yurgelun-<br />

Todd, 2004) and, centrally, as modulations of electrophysiological (Liddell, Williams, Rathjen,<br />

Shevrin, & Gordon, 2004; Williams et al., 2004) and fMRI response, notably in the amygdala<br />

(Morris, Ohman, & Dolan, 1999; Pessoa, Japee, Sturman, & Ungerleider, 2006; Whalen, et al.,<br />

1998). So far, the studies on nonconscious emotional processing have exclusively relied on static<br />

images. However, the ecological relevance of static stimuli might be limited, in comparison to<br />

dynamic stimuli conveying biological motion cues that are omnipresent in natural vision. Along this<br />

line, several studies using visible faces have shown that compared to static expressions, dynamic<br />

expressions are better recognized and are associated with enhanced neural activity (Sato,<br />

Kochiyama, Yoshikawa, Naito, & Matsumura, 2004; Trautmann, Fehr, & Herrmann, 2009). Yet, as<br />

the study of temporal integration without awareness has been largely uncovered, it remains<br />

unknown whether dynamic cues would be processed at all under nonconscious perceptual<br />

conditions.<br />

Here, we investigated this issue with fMRI, by measuring BOLD responses to static and<br />

dynamic facial expressions rendered undiscriminable through gaze-contingent crowding (GCC).<br />

Crowding is the perceptual phenomenon whereby a peripheral stimulus is perceived as jumbled<br />

when it is flanked by similar neighbours (Levi, 2008). Under such conditions, while the stimulus<br />

remains detectable, it is undiscriminable to the observer. When crowding is combined with gazecontingent<br />

control, which consists in substituting the critical peripheral stimulus with an irrelevant<br />

content as soon as the observer's attempted to gaze at it, conscious access to facial expressions is


fully prevented (Faivre & Kouider, 2011). Using this approach, we recently reported that both static<br />

and dynamic facial expressions can bias evaluative judgments in a nonconscious manner (Kouider,<br />

Berthet, & Faivre, 2011). Participants were more likely to rate an unknown Chinese character as<br />

pleasant when preceded by a face depicting happiness compared to a face depicting anger, while,<br />

crucially, they performed at chance-level when discriminating the emotion of the crowded face.<br />

Furthermore, complementary controls with a neutral baseline revealed that the nonconscious origin<br />

of the preference bias that we obtained stemmed primarily from the processing of facial expressions<br />

conveying positive emotions, regardless of their static or dynamic properties.<br />

In the present study, we combined this behavioral approach with an fMRI paradigm in order<br />

to assess whether nonconscious processing of static and dynamic facial expressions is sustained by<br />

common neural pathways. Following our previous behavioral results, we focused more specifically<br />

on positive emotions, by measuring the influences of undiscriminable happy compared to neutral<br />

faces on pleasantness ratings (see Figure 1). This comparison with a neutral baseline allowed to<br />

specifically assess the extent to which crowded emotional information is preserved along the<br />

subcortical and cortical pathways.


Methods<br />

Participants . Eighteen right-handed volunteers (12 females, 6 males; aged 18 to 35) took part in<br />

the study, which was approved by the local ethical comity. All participants had a normal vision,<br />

with no past history of psychiatric and neurological disease. They gave written informed consent<br />

and were paid for their participation. None of them was able to read Chinese.<br />

Stimuli. Stimuli were recorded from five female actresses recruited from a professional acting<br />

academy. Actresses' face was filmed against a black background, in an equally held illumination<br />

room. Each face expressed happiness (HA, with a mouth opening motion revealing the teeth, and a<br />

narrowing of the eyes), or was neutral (NE, with a mouth chewing movement and a cyclic opening<br />

and narrowing of the eyes). Compared to other baseline conditions relying on mosaics of scrambled<br />

faces or morphed faces, this chewing movement provided an ecological, and emotionally neutral<br />

control. Emotional paroxysms were defined by two independent observers. Videos were slightly<br />

speeded up or down to compensate the differences between the timings of the different actors'<br />

expressions. All videos were matched for average luminance, contrast, and image size and were<br />

cropped to show the face only such as measuring 3° x 3°. Snapshots were extracted from each<br />

movie, at t = 1100ms for the emotional paroxysm condition, and at at t = 0ms for the neutral<br />

expression condition (as the facial configuration during the chewing movement was not always the<br />

same at t=1100ms, we preferred to extract the snapshot at t=0ms, when all actresses had the mouth<br />

closed and the eyes opened). Each video started with a neutral expression (100ms), followed by<br />

emotional progression until paroxysm (1000ms), and dynamical maintenance at the peak level<br />

(100ms). The flankers were created by blending 2 non emotional faces and 4 objects together,<br />

resulting in 2° x 2° non informative patterns. The six flankers surrounding the face were selected<br />

randomly on each trial from a set of forty possible flankers. The luminance of the flankers was 40%<br />

higher than that of the face. Targets were 3° x 3° Chinese pictographs, chosen randomly on each


trial from a set of 180 pictographs, without repetition for a single subject.<br />

Apparatus. Stimuli were displayed against a black background by an Epson video projector (EMP-<br />

8300, refresh rate 60Hz, resolution 1024x768, pitch 0.023°/pixel) on a computer running Matlab<br />

with the Psychophysics Toolbox (Brainard, 1997; Pelli, 1997). Eye movements were recorded<br />

monocularly with an fMRI compatible eye tracker (Eyelink 1000 system, SR research, Ontario,<br />

Canada) controlled with the Eyelink toolbox (sampling rate 500Hz; spatial resolution > 1°).<br />

Answers were collected from two stickers buttons (fiber optic response device, Current Designs,<br />

Philadelphia, USA).<br />

Procedure. The entire experiment consisted in a total of 180 priming trials intermixed randomly<br />

with 60 visibility trials and 34 baseline trials, equally divided in 2 blocks of 137 trials. A calibration<br />

phase was performed after each block. Each block contained exclusively either dynamic (dyn) or<br />

static (stat) stimuli, consisting in happy or neutral faces. Two counterbalanced groups of<br />

participants were defined depending on the sequence of blocks they were assigned to (i.e., either<br />

[dyn-stat] or [stat-dyn]). Each trial started with a 0.5° x 0.5° fixation cross for 300ms with a jitter of<br />

200ms. The face was displayed statically or dynamically for 1200 ms surrounded by six flankers<br />

(14° eccentricity between face and fixation cross centered at the quarter top of the screen; 2.6°<br />

center to center distance). Importantly, as soon as gaze monitoring was lost or as soon as a<br />

participant ceased to gaze at a fixation area consisting in a zone of 5° by 5° surrounding the fixation<br />

cross, the face was substituted by the same face with a neutral expression (physically different from<br />

the one used as the baseline condition), guaranteeing that the emotional face was never seen<br />

foveally. This occurred on 1.5% (SD = 2.42) of trials, corresponding to 0.03% (SD = 0.05) of total<br />

looking time. In three out of four trials, the participant’s task was to indicate whether a Chinese<br />

pictograph displayed for 150 ms at the fixation location was pleasant (right button press) or<br />

unpleasant (left button press). They were instructed to follow a spontaneous intuition, and to


provide an answer in less than a second. Randomly, in one out of four trials, a question concerning<br />

the facial expression appeared at the fixation location instead of the Chinese pictograph.<br />

Participants could read either “Happiness?”, or “Neutral?”. They had to answer by pressing the right<br />

button if they thought the answer was yes, or the left button if they thought it was no, within a delay<br />

of 5200ms. The visibility question concerned uniquely the facial expression and was not related to<br />

the surrounding flankers. In the baseline trials, only the six flankers and the fixation cross appeared<br />

on the screen for 1200ms, participants were instructed not to press any button. The experiment was<br />

divided in 2 blocks of 7mn each.<br />

Figure 1. A. Experimental procedure: while participants continously stared at a fixation cross, they were exposed for<br />

1200ms to a peripheral face surrounded by uninformative flankers. The face could express happiness or be neutral,<br />

either statically or dynamically. Importantly, whenever participants stopped gazing at the fixation cross, the peripheral<br />

face was substituted by a different neutral face, guaranteeing that facial expressions were never being discriminated. On<br />

75% of trials, participants evaluated the pleasantness of a subsequent Chinese pictograph displayed at the fixation<br />

location. On the remaining 25% of trials, randomly assigned, participants had 5200ms to indicate whether the peripheral<br />

face reflected a happy or neutral face. B. Behavioral results: pleasant response rate (mean = 52.4%, SD = 14.9) varied<br />

significantly as a function of the facial expression, with higher ratings induced by happy compared to neutral faces<br />

[7.4%; t 17=2.20; p < 0.05], regardless of the static or dynamic nature of the face (F < 1). Participants confessed seeing<br />

only a grayish, jumbled collection of pictures at the bottom of the screen, and being unable to discriminate a central face<br />

among the flankers. Signal detection analysis revealed chance-level performance for all expression types (mean d' =<br />

0.19; t 17 = 1.15, p = 0.26) regardless of their static or dynamic nature (t 17= 1.37, p = 0.20).


Functional localizer. Twelve blocks of 20 pictures each, half the blocks containing objects (food,<br />

watches, cars, cups) and the other half faces (half men and half women) were shown on the screen<br />

against a black background. Faces and objects were presented centrally in order to escape from selfcrowding,<br />

a situation in which the different features inside an object crowd each other (Martelli,<br />

Majaj, & Pelli, 2005). Each image was displayed for 500ms and followed by a 500ms black screen.<br />

A 3 seconds fixation cross was displayed between the counter-balanced blocks. Participants were<br />

requested to attend to the pictures, but not to press any button. The functional localizer lasted 5<br />

minutes.<br />

fMRI data acquisition. Whole brain imaging was conducted on a 3T Trio Siemens scanner (Tim<br />

32 channels), at the Centre de Neuroimagerie de Recherche at the Salpetriere Hospital in Paris.<br />

Functional T2* weighted images were obtained in an interleaved order using a single-shot echoplanar<br />

gradient-echo (EPI) pulse sequence (43 slices oriented on the anterior to posterior<br />

commissure axis with no interslice gap , resolution 3 x 3 x 3mm, repetition time TR = 2100ms, echo<br />

time TE = 25ms, flip angle 90°). The functional images were processed using the SPM8 software<br />

(Wellcome Department of Cognitive Neurology, London, UK). Three initial volumes were<br />

discarded to eliminate nonequilibrium effects of magnetization. The functionnal preprocessing<br />

included slice timing (middle reference slice), spatial realignement, spatial normalization (MNI<br />

stereotactic space, 2mm voxel resampling) and spatial smoothing (Gaussian kernel with 8mm fullwidth<br />

at halfmaximum). Low-frequency drifts were eliminated using a temporal high-pass filter at<br />

1/128Hz. Statistical evaluation was performed using the general linear model (GLM). Regressors<br />

modeled the eight different trials of interest ([expression valence] HA/NE x [expression type] dyn/stat x<br />

[preference judgement] pleas/unpleas ), as well as baseline and facial expression discrimination trials. The<br />

convolution used delta functions with a hemodynamic response function (HRF) and its time and<br />

dispersion derivatives. In addition, estimated motion parameters were included as covariates of no


interest to increase statistical sensitivity. The brain activations of all eight critical conditions were<br />

contrasted against baseline. Linear contrasts lead to the main effect of preference bias in the static<br />

condition (i.e., [HA pleas +HA unpleas ] stat > [NE pleas + Ne unpleas ] stat ) and dynamic condition (i.e.,<br />

[HA pleas +HA unpleas ] dyn > [NE pleas + Ne unpleas ] dyn ). For random effect group analyses, the individual<br />

contrast images were smoothed (Gaussian kernel with 6 mm full-width at half maximum) and<br />

submitted to one sample two-tailed t-tests. All images were thresholded at p < 0.001, uncorrected. A<br />

small volume correction (cluster-wise threshold of p < 0.05, FWE-corrected for multiple<br />

comparisons within the search volume) was conducted relatively to a priori hypothesis regarding<br />

activity in the amygdala (dilated 5x). The search volume was created from the AAL brain atlas<br />

(Tzourio-Mazoyer et al., 2002), and was applied to the SPM dataset using WFU-Pickatlas (Maldjian<br />

et al., 2003). For the face-localizer, preprocessing and 1st-level statistics were analogous to the<br />

preference bias data. We localized regions in the fusiform gyrus showing more activation for faces<br />

compared to objects (at a voxel-wise threshold of p < 0.001, uncorrected). Four out of nineteen<br />

participants were discarded due to the absence of activations in the fusiform area (although they<br />

were included in the whole brain analysis). Mean FFA localization was x, y, z = -40, -53, -19; x, y, z<br />

= 40, -50, -22 for the left and right FFA, respectively. To measure FFA modulation in happy vs.<br />

neutral facial expressions, we measured the peak of percent signal change within each participantspecific<br />

ROIs.<br />

Functionnal connectivity analysis. We conducted a psychophysiological interaction (PPI) analysis<br />

to examine FFA connectivity during the nonconscious processing of facial expressions in the static<br />

and dynamic conditions (Friston et al., 1997). For each participant, we extracted the time series of<br />

activity from a 5mm radius sphere centered on the individual peak of activity in the FFA clusters, as<br />

previously defined by the face-localizer analysis. The static and the dynamic psychological<br />

variables were constructed for each subject as [HA-NE] stat and [HA-NE] dyn respectively. We<br />

constructed two separate GLM with the time series of activity in the FFA as a first regressor, and as<br />

second and third regressors, the static or dynamic psychological variable and its interaction with the


time series. Separately for the static and the dynamic conditions, we entered the estimated<br />

parameter estimates for the interaction regressor in a between-subject, random-effect analysis for<br />

obtaining statistical parametric maps. We identified brain activations exhibiting significant contrasts<br />

of parameter estimates with a voxel-wise threshold (p < 0.001, uncorrected), and a cluster-wise<br />

treshold of p < 0.05, FWE-corrected for multiple comparisons within the search volume. This small<br />

volume correction was conducted relatively to the a priori hypothesis derived from the main effect<br />

of static facial expressions processing. The search volume was created from the AAL brain atlas<br />

(Tzourio-Mazoyer et al., 2002) in order to include the amygdala (dilated 5x). It was applied to the<br />

SPM dataset using WFU-Pickatlas (Maldjian et al., 2003).


Results and discussion<br />

Whole-brain results for static faces.<br />

We first focused on the the whole brain activity elicited by static facial expressions, by<br />

comparing the influences of happy (HA) vs. neutral (NE) faces on the preference judgement task.<br />

Unless stated otherwise, all effects were tested at a threshold of p < 0.001, uncorrected. Importantly,<br />

all regions showing significant effects reflected increased activity for the HA in comparison to the<br />

NE condition (see Figure 2 & Table 1). At the subcortical level, we found activations in the right<br />

amygdala (cluster-wise threshold p < 0.01 FWE-corrected for the search volume). The left<br />

amygdala was activated with a lower threshold of p < 0.002 (cluster-wise threshold p < 0.05 FWEcorrected<br />

for the search volume). This structure has been argued to be crucial for the emotional<br />

processing of both negative and postivive facial expressions (Costafreda, Brammer, David, & Fu,<br />

2008). In addition, we observed bilateral activations in the hippocampus, which has been linked to<br />

the contextual processing of emotional faces (Whalen et al., 1998), and in the left caudate nucleus<br />

(right caudate nucleus, p < 0.004), which is involved in response selection during goal-directed<br />

action (Chaudhry, Parkinson, Hinton, Owen, & Roberts, 2009). At the cortical level, activations<br />

were observed exclusively in temporal and frontal lobes. For frontal regions, we found bilateral<br />

activation in the middle orbitofrontal cortex and in the right anterior cingulate cortex, with a<br />

marginal activation in the left hemisphere (p < 0.003). <strong>These</strong> regions are arguably involved in<br />

mechanisms of response selection (see discussion). For temporal regions, activations were found in<br />

the bilateral inferior temporal and right fusiform cortex (left hemisphere, p < 0.004), including the<br />

Fusiform Face Area (FFA, see below). The FFA is described as preferentially encoding both facial<br />

identity (Kanwisher & Yovel, 2006) and facial expressions like happiness (Breiter et al., 1996;<br />

Ganel, Valyear, Goshen-Gottstein, & Goodale, 2005) or fear (Winston, Vuilleumier, & Dolan,<br />

2003). This is to our knowledge the first evidence for a modulation of the FFA by nonconscious<br />

facial expressions. In addition, the right superior temporal sulcus (STS), previously associated with


the nonconscious perception of facial identity (Kouider, Eger, Dolan, & Henson, 2009) and facial<br />

expressions (Jiang & He, 2006), was also observed here although with a more lenient threshold of p<br />

< 0.004.<br />

Whole-brain results for dynamic faces.<br />

We then turned to the same contrast of HA compared to NE faces but now for dynamic<br />

expressions. This contrast revealed activity increases in similar regions as for the static faces,<br />

including the left hippocampus (p < 0.002) and right orbitofrontal cortex (p < 0.004). Several<br />

regions observed in the static condition were not found here, including the caudate nucleus and the<br />

amygdala at the subcortical level, and the cingulate and fusiform cortices and FFA at the cortical<br />

level. Interestingly, the absence of amygdala activity during the processing of dynamic emotions<br />

was compensated here by bilateral activity in the substantia innominata (right hemisphere p <<br />

0.001; left hemisphere p < 0.005), a subcortical structure often considered as part of the extended<br />

amygdala (Sah, Faber, Lopez de Armentia, & Power, 2003). Furthermore, we found additional<br />

regions activated specifically by dynamic facial expressions, including the left superior medial<br />

frontal cortex, and portions of the parietal lobe including the right posterior parietal cortex (left<br />

hemisphere p < 0.003) and the left supra marginal cortex (p < 0.005) (see Figure 2 & Table 1).<br />

In order to test for the specificity of the pattern of results we report here, we carried out a region of<br />

interest analysis for the dynamic condition on the regions obtained from the whole brain analysis<br />

for the static condition. No effect was found in the amygdala, the fusiform cortex, the inferior<br />

temporal cortex, the cingulate cortex, and the right superior temporal sulcus (all p > 0.2).<br />

Furthermore, we carried out a region of interest analysis for the static condition on the regions<br />

obtained from the whole brain analysis for the dynamic faces. No effect was found in the substantia<br />

innominata, nor in the posterior parietal cortex (both p > 0.6).


However, the absence of FFA activity in the dynamic condition might have resulted from a wholebrain<br />

analysis strategy, which fails to take into account the interindividual anatomic variability of<br />

this kind of structures (Saxe, Brett, & Kanwisher, 2006). To address this issue, we relied next on the<br />

use of functional regions of interest.<br />

Figure 2. Whole-brain functional results. Sagittal, axial and coronal sections showing clusters of activity for HA<br />

compared to NE facial expression, in the static condition (top, including parahippocampic regions, amygdala, right<br />

superior temporal sulcus and bilateral orbitofrontal cortices), and dynamic condition (bottom, including left<br />

hippocampus, bilateral substantia innominata and left posterior parietal cortex). An uncorrected threshold of p = 0.005<br />

was used to display the contrasts.


Functional region of interest in the FFA<br />

Using a functional localizer, we defined the FFA for each participant in a separate scan<br />

session following the main experiment (see methods), and measured how this functional cluster is<br />

modulated by facial expressions. This analysis revealed activation increases in both left and right<br />

FFA for static faces [left hemisphere: parameter estimate = 0.82; t 14 = 3.46; p < 0.005; right<br />

hemisphere: parameter estimate = 0.85; t 14 = 3.29; p < 0.01], but not dynamic faces [left<br />

hemisphere: parameter estimate = -0.03; t 14 = 0.09; p = 0.93; right hemisphere: parameter estimate<br />

= -0.28; t 14 = -0.80; p < 0.43] (see Figure 3), thus confirming that the FFA modulation is specific to<br />

static faces. Furthermore, we computed a linear regression between the preference bias (as<br />

calculated by subtracting the pleasant response rate in the happy vs. neutral condition) and the<br />

activity extracted from the FFA. Consistent with the specific role of the FFA in the nonconscious<br />

processing of static facial expressions, we found that the increase of FFA activity was correlated<br />

with the behavioral bias on preference judgment in the static (adjusted R-squared = 0.24; p < 0.05),<br />

but not dynamic stimulation condition (adjusted R-squared = -0.07; p = 0.9). It is of note that our<br />

FFA localizer session was performed with static faces (see Methods) and thus one might argue that<br />

the absence of FFA modulations for dynamic facial expressions reflects a mislocalization. However,<br />

since brain regions revealed by static and dynamic localizers largely overlap (Fox, Iaria, & Barton,<br />

2009; Schultz & Pilz, 2009), these results rather suggest, as we discuss below, that dynamic stimuli<br />

are processed preferentially along dorsal rather than ventral visual pathways.


Figure 3. Region of interest functional results. Neural activity in the left and right Fusiform Face Area (FFA) induced<br />

by happy compared to neutral faces, in the static and dynamic stimulation conditions (** p < 0.01).


Functional connectivity in the FFA<br />

In the static facial expression condition, the PPI analysis revealed a significant functional<br />

connectivity between the left FFA and the left amygdala (17 voxels, x, y, z = -20, -2, -20, voxel-wise<br />

threshold Z = 3.25, p < 0.001 uncorrected; cluster-wise threshold p < 0.05 FWE-corrected for the<br />

search volume), and between the right FFA and the right amygdala (18 voxels, x, y, z = 32, 2, -20,<br />

voxel-wise threshold Z = 3.25, p < 0.001 uncorrected; cluster-wise threshold p < 0.01 FWEcorrected<br />

for the search volume). Importantly, this pattern of results suggests that beyond simple coactivation,<br />

the FFA interacts with the amygdala during the nonconscious processing of static facial<br />

expressions. It is of note however that the PPI analysis does not provide any clues regarding the<br />

direction of these interactions (i.e., from the FFA to the amygdala or from the amygdala to the FFA,<br />

see Discussion). As expected by the previous results we obtained, we found that this pattern of<br />

functional connectivity was nonexistent in the dynamic condition (functional connectivity between<br />

left FFA and left amygdala : Z = 0.09; between right FFA and right amygdala : Z = -1.25) Here, a<br />

functional localizer of dynamic faces would be necessary in order to infer which brain regions<br />

interact during the nonconscious processing of emotional movies.<br />

Figure 4. Functionnal connectivity in the FFA . Physchophysiological interactions with seeds placed on the right FFA<br />

(yellow) and left FFA (red). Results show lateralized interactions between the FFA and the amygdala in the static (left<br />

hemisphere: p < 0.05; right hemisphere: p < 0.01; both FWE-corrected for the search volume), but not in the dynamic<br />

condition.


Discussion.<br />

In this study, we assessed which brain regions are involved during the nonconscious<br />

processing of crowded facial expressions. Our results revealed the existence of two patterns of<br />

activation depending on the static (i.e., pictures) or dynamic (i.e., videos) nature of facial<br />

expressions. At the subcortical level, we found that crowded static happy faces activated the<br />

bilateral amygdalae, in coherence with previous studies using visual masking (Killgore & Yurgelun-<br />

Todd, 2004; however, see Whalen et al., 1998 for a decrease in activity compared to fixation) and<br />

binocular rivalry (Williams et al., 2004). Interestingly, dynamic facial expressions did not involve<br />

the amygdala, but rather the substantia innominata, a sublenticular structure of the basal forebrain<br />

that is contiguous with the dorsal amygdala. This region has previously been linked to the conscious<br />

perception of facial familiarity (Wright et al., 2003) and facial expression, with a higher sensitivity<br />

to emotional arousal rather than emotional valence (Breiter et al., 1996; Kim, Somerville,<br />

Johnstone, Alexander, & Whalen, 2003; Whalen et al., 1998).<br />

How are these subcortical structures involved in emotional processing? On the one side, it<br />

has been suggested that the amygdaloid complex can be triggered without relying on any visual<br />

cortical relay, through a short subcortical route involving superior colliculus and inferior pulvinar<br />

(LeDoux, 1998). Invisible facial expressions are thus considered to bypass striate and extrastriate<br />

areas along the ventral visual pathways. In this context, the observation of FFA increase for static<br />

facial expressions could reflect feedback from the amygdala, rather than a direct stimulation from<br />

visual cortical regions (Dolan, Morris, & de Gelder, 2001). It is of note, however, that this classical<br />

view, which is primarily based on data obtained from rodents during auditive negative conditioning,<br />

has been criticized for being generalized to nonconscious fear perception in the absence of reliable<br />

evidence in humans (Morris et al., 1999; Ohman, Carlsson, Lundqvist, & Ingvar, 2007). On the<br />

other side, a recent alternative has challenged the existence of a direct subcortical pathway for the<br />

processing of emotions (Pessoa & Adolphs, 2010). The authors propose instead that emotional


stimuli are processed rapidly along parallel extrastriate cortical routes before triggering the<br />

amygdaloid complex. In this framework, the amygdala is triggered by cortical inputs, after<br />

elaborated visual processing has taken place in ventral visual regions, and plays a broader role,<br />

notably in recognizing the social value of stimuli (Tsuchiya, Moradi, Felsen, Yamazaki, & Adolphs,<br />

2009). One could argue that since both static and dynamic stimuli were presented peripherally, it is<br />

likely that low spatial frequency information was at the origin of the effects we found, suggesting<br />

its subcortical origin (Winston et al., 2003). However, it has been shown that magnocellular<br />

pathways conveying low spatial frequency information also reach the early visual cortex and then<br />

project to parietal and frontal cortices (Bullier, 2001), conveying coarse information about the gist<br />

of a visual scene, here probably rough aspects of the facial expressions (Kveraga, Boshyan, & Bar,<br />

2007).<br />

Now regarding the cortical patterns of activation elicited by static facial expressions, our<br />

results revealed a main locus of activations in ventral visual pathways, including the FFA. PPI<br />

analysis revealed that the FFA was functionally connected with the amygdala. Furthermore, we<br />

measured a positive correlation between the modulation amplitude of FFA activity and the<br />

amplitude of the behavioral preference bias. From a methodological point of view, this finding<br />

contrasts with the absence of effect reported by a previous study using fearful static faces<br />

suppressed from awareness by continuous flash suppression (CFS), a variant of binocular rivalry<br />

allowing for sustained periods of invisibility (Jiang & He, 2006). Although it remains possible that<br />

this discrepancy results from different types of emotional valence between the two studies (i.e.,<br />

happiness here vs. fear in Jiang & He), it is likely that ventral visual regions, such as the FFA, are<br />

less sensitive, or arguably not sensitive at all to suppressed signals in CFS (Almeida, Mahon,<br />

Nakayama, & Caramazza, 2008; Lin & He, 2009). In this respect, the Gaze-Contingent Crowding<br />

approach seems to overcome this limitation. Indeed, the involvement of ventral regions revealed by<br />

the present study corroborates with a previous behavioral finding showing that crowded faces are


processed holistically (Kouider et al., 2011), a cognitive operation implying the FFA (Kanwisher &<br />

Yovel, 2006). Thus, we suggest that the cortical processing of emotional information resists<br />

crowding. To sum up, we propose that despite crowding, static expressions are processed along the<br />

ventral visual pathways (i.e., temporal regions, including FFA), trigger parahippocampic regions<br />

(including hippocampus, caudate nucleus and amygdala) connected to the prefrontal areas<br />

(including cingulate and orbitofrontal cortex) underlying preference judgment.<br />

For dynamic facial expressions, the cortical pattern of activations was instead restricted to<br />

dorsal regions, including the posterior partietal cortex, which is functionally specialized for the<br />

processes of spatially guided behavior and biological motion imagery (Cavanna & Trimble, 2006).<br />

Additionally, we found a marginally significant effect in the left supramarginal gyrus, a dorsal<br />

structure whose lesions impair judging emotional faces (Adolphs, Damasio, Tranel, Cooper, &<br />

Damasio, 2000) and body motion (Heberlein, Adolphs, Tranel, & Damasio, 2004). We propose that<br />

these regions trigger subcortical structures coding for stimulus arousal (i.e., substantia innominata)<br />

which finally orient the preference judgment through orbitofrontal cortex modulation (see Figure 4).<br />

As described above, unexpectedly, several regions elicited by static faces were not elicited by<br />

dynamic faces, including the STS, usually associated with the conscious processing of various<br />

biological motions (Puce & Perrett, 2003). According to two influential models of conscious face<br />

perception (Bruce & Young, 1986; Haxby et al., 2000), invariant aspects of faces like identity are<br />

encoded in the face-responsive regions of the fusiform gyrus (including the FFA), while changeable<br />

aspects like facial expressions primarily activate the face-responsive regions of the temporal sulcus<br />

(including the STS). Along this line, a recent study showed that dynamic faces do not produce a<br />

greater response than static faces in the STS, but not in the FFA (Pitcher, Dilks, Saxe, Triantafyllou,<br />

& Kanwisher, 2011). Contradictory findings show that compared to static faces, dynamic faces<br />

expressing happiness are associated with greater activity in the fusiform gyrus (Sato et al., 2004),


and in the STS and FFA (Trautmann et al., 2009; Kessler et al., 2011). At first sight, these results<br />

dealing with conscious perception might seem at odd with the ones we report, and with the fact that<br />

temporal cues play an important role in the nonconscious processing of changeable aspects of faces<br />

like emotional expressions. A possible explanation is that in the presence of facial motion<br />

information, the dorsal pathway is triggered in the first place following a feed-forward sweep of<br />

information processing, while the ventral visual pathway is triggered afterward, through top-down<br />

mechanisms taking place only when the stimuli are consciously visible (Lamme & Roelfsema,<br />

2000). Even if distinctions in terms of neuroanatomy and functional dissociation are less pure than<br />

originally considered (Farivar, Blanke, & Chaudhuri, 2009), the pattern of results we observed<br />

questions the capacity to integrate form information (i.e., ‘snapshots’ of expressive faces by neurons<br />

in the ventral pathway) and motion information (i.e., integrated optic flow patterns by neurons in<br />

the dorsal pathway) without awareness, as proposed elsewhere to account for the conscious<br />

recognition of biological motion (Giese & Poggio, 2003).<br />

As concerns the mechanisms underlying preference judgment, we propose two nonexclusive<br />

mechanisms to account for the nonconscious behavioral bias we observed. The first one is<br />

the building of implicit associations between the valence of facial expressions and the subsequent<br />

preference judgment. Indeed, we found that regardless of their static or dynamic nature, both<br />

stimulus types were associated with hippocampic activations, classically described as mediating the<br />

contextual evaluation of emotional stimuli, and together with the amygdaloid complex, as mediating<br />

implicit learning for visible or unvisible stimuli (Morris, Ohman, & Dolan, 1998). The second<br />

mechanism is a modulation of the implicit aesthetic preferences computation, which is described as<br />

reliying on the activity of cortical and subcortical areas implicated in the processing of reward. In<br />

agreement, we found that both static and dynamic happy faces preferentially triggered orbitofrontal<br />

cortex (bilateral activations with static faces, right activation with dynamic faces), a region which is<br />

known among the primates to comprise face-selective neurons activated by temporal cortical inputs


(Thorpe, Rolls, & Maddison, 1983) to encode face expression and mediate related social<br />

reinforcement (Rolls, Critchley, Browning, & Inoue, 2006), but also to process aesthetic beauty in<br />

its medial part (Kawabata & Zeki, 2004).<br />

Figure 5. Tentative description of brain regions involved during preference judgment biases with static and dynamic<br />

facial expression. During visual stimulation (crowded display on the left), we found that ventral temporal regions<br />

including the FFA and STS responded to static facial expressions, while dorsal parietal regions (PPC) responded<br />

specifically to dynamic facial expressions. The cortical processing occurring in these different regions consequently<br />

trigger subcortical structures (Am by static expressions, as shown by our PPI analysis, SI by dynamic expressions, for<br />

which the connection with PPC remains undocumented). We propose that the preference judgment bias is mediated<br />

afterward, both by frontal regions triggered by subcortical inputs (OFC and ACC for static expressions, OFC for<br />

dynamic expressions), and by hippocampic activity potentially mediating stimulus response associations. PPC<br />

Posterior Parietal; FFA fusiform face area; STS Superior Temporal Sulcus; Am amygdala; SI substantia innominata;<br />

Hipp hippocampus; OFC orbitofrontal cortex; ACC anterior cingulate cortex; Green stands for activations specific to<br />

dynamic faces, blue stands for activations specific to static faces, red for common activations to static and dynamic<br />

faces.


Conclusion.<br />

This study conjoined two important findings. First, taking advantage of gaze-contingent<br />

crowding, a novel approach for studying undiscriminable and long-lasting stimuli, we were able to<br />

demonstrate that emotional pictures and emotional videos were processed along different neural<br />

pathways. Refering to the dual-stream theoretical framework (Goodale & Milner, 1992), we<br />

proposed that static facial expressions were processed through the ventral visual pathway, including<br />

the FFA which was functionnally connected with the amygdala. We observed that the same<br />

emotions expressed dynamically were processed through the dorsal visual pathway, including the<br />

posterior parietal cortex, together with dorsal subcortical structures such as the substantia<br />

innominata. <strong>These</strong> results concerning the nonconscious processing of biological motion question the<br />

existence of form-motion integration (Giese & Poggio, 2003), and more generally of nonconscious<br />

temporal integration, a fundamental property of nonconscious cognition which has remained largely<br />

unconvered so far. Second, we found that undiscriminable facial expressions were encoded such as<br />

to bias a high-level cognitive function such as preference judgment. We proposed that the bias arose<br />

from both evaluation of the emotionnal context and aesthetic preferences computation, respectively<br />

supported by the hippocampus and the orbitofrontal cortex, which were activated by static and<br />

dynamic facial expressions. This shows that crowded information can modulate a broad set of brain<br />

regions supporting high-level cognitive functions, despite being reflected subjectively as a jumbled,<br />

uninformative experience.


Conditions Anatomy CE Z score p threshold x y z<br />

Static Faces<br />

Left hippocampus 52 3,78 0.001 -24 -28 -8<br />

Right hippocampus 128 3,79 0.001 20 -10 -18<br />

Right amygdala 128 3,79 0.001 30 0 -20<br />

Left amygdala 24 3,20 0.002 -32 -6 -16<br />

Right caudate nucleus 8 3,06 0.004 20 -10 24<br />

Left caudate nucleus 7 3,92 0.001 -6 -18 24<br />

Right middle orbitofrontal cortex 26 3,87 0.001 14 32 0<br />

Left middle orbitofrontal cortex 12 3,49 0.001 -12 32 -10<br />

Right anterior cingulate cortex 51 3,77 0.001 20 26 22<br />

Left middle cingulate cortex 15 2,94 0.003 -8 -2 32<br />

Right fusiform cortex 8 4,04 0.001 28 -44 -4<br />

Left fusiform cortex 11 2,89 0.004 -26 -44 -12<br />

Right superior temporal sulcus 26 2,86 0.004 46 -62 10<br />

Right inferior temporal cortex 92 2,82 0.002 42 0 -38<br />

Left inferior temporal cortex 8 3,02 0.001 -52 4 -40<br />

Right precentral cortex 8 3,41 0.001 42 -2 38<br />

Conditions Anatomy CE Z score p threshold x y z<br />

Dynamic Faces<br />

Left hippocampus 41 3,29 0.002 -28 -30 -8<br />

Right substantia innominata 10 3,30 0.001 14 -4 -8<br />

Left substantia innominata 8 2,83 0.005 -16 -2 -8<br />

Right middle orbitofrontal cortex 9 2,84 0.004 34 22 42<br />

Left superomedial frontal cortex 21 3,89 0.001 -12 60 30<br />

Right posterior parietal cortex 10 3,13 0.001 -2 -56 38<br />

Left posterior parietal cortex 19 2,75 0.003 2 -54 50<br />

Table 1. Cluster extent (CE), statistical values, and stereotaxic brain atlas coordinates for the brain<br />

regions activated by viewing happy compared to neutral crowded faces in the static and dynamic<br />

conditions.


Bibliography.<br />

Adolphs, R., Damasio, H., Tranel, D., Cooper, G., & Damasio, A. R. (2000). A Role for<br />

Somatosensory Cortices in the Visual Recognition of Emotion as Revealed by Three-<br />

Dimensional Lesion Mapping. J. Neurosci., 20(7), 2683-2690.<br />

Almeida, J., Mahon, B. Z., Nakayama, K., & Caramazza, A. (2008). Unconscious processing<br />

dissociates along categorical lines. Proceedings of the National Academy of Sciences of the<br />

United States of America, 105(39), 15214–15218. doi:10.1073/pnas.0805867105<br />

Brainard, D. H. (1997). The Psychophysics Toolbox. Spatial Vision, 10(4), 433–436.<br />

Breiter, H. C., Etcoff, N. L., Whalen, P J, Kennedy, W. A., Rauch, S L, Buckner, R. L., Strauss, M.<br />

M., et al. (1996). Response and habituation of the human amygdala during visual processing<br />

of facial expression. Neuron, 17(5), 875-887.<br />

Bruce, V. & Young, A. (1986). Understanding face recognition. British journal of psychology, 77,<br />

305–327.<br />

Bullier, J. (2001). Integrated model of visual processing. Brain Research. Brain Research Reviews,<br />

36(2-3), 96-107.<br />

Cavanna, A. E., & Trimble, M. R. (2006). The precuneus: a review of its functional anatomy and<br />

behavioural correlates. Brain, 129(3), 564 -583. doi:10.1093/brain/awl004<br />

Chaudhry, A. M., Parkinson, J. A., Hinton, E. C., Owen, A. M., & Roberts, A. C. (2009). Preference<br />

judgements involve a network of structures within frontal, cingulate and insula cortices.<br />

European Journal of Neuroscience, 29(5), 1047–1055. doi:10.1111/j.1460-<br />

9568.2009.06646.x<br />

Costafreda, S. G., Brammer, M. J., David, A. S., & Fu, C. H. Y. (2008). Predictors of amygdala<br />

activation during the processing of emotional stimuli: a meta-analysis of 385 PET and fMRI<br />

studies. Brain Res Rev, 58(1), 57–70. doi:10.1016/j.brainresrev.2007.10.012<br />

Dolan, R. J., Morris, J. S., & de Gelder, B. (2001). Crossmodal binding of fear in voice and face.<br />

Proceedings of the National Academy of Sciences of the United States of America, 98(17),


10006 -10010. doi:10.1073/pnas.171288598<br />

Esteves, F. (1994). Automatically Elicited Fear: Conditioned Skin Conductance Responses To<br />

Masked Facial Expressions. Cognition and Emotion, 8, 99-108.<br />

Faivre, N., & Kouider, S. (2011). Multi-feature objects elicit nonconscious priming despite<br />

crowding. Journal of Vision, 11(3). doi:10.1167/11.3.2<br />

Farivar, R., Blanke, O., & Chaudhuri, A. (2009). Dorsal-ventral integration in the recognition of<br />

motion-defined unfamiliar faces. The Journal of Neuroscience: The Official Journal of the<br />

Society for Neuroscience, 29(16), 5336-5342. doi:10.1523/JNEUROSCI.4978-08.2009<br />

Fox, C. J., Iaria, G., & Barton, J. J. S. (2009). Defining the face processing network: optimization of<br />

the functional localizer in fMRI. Human Brain Mapping, 30(5), 1637-1651.<br />

doi:10.1002/hbm.20630<br />

Friston, K.J., Buchel, C., Fink, G.R., Morris, J., Rolls, E., and Dolan, R. Psychophysiological and<br />

modulatory interactions in Neuroimaging. NeuroImage, 6:218-229, 1997.<br />

Ganel, T., Valyear, K. F., Goshen-Gottstein, Y., & Goodale, Melvyn A. (2005). The involvement of<br />

the « fusiform face area » in processing facial expression. Neuropsychologia, 43(11), 1645-<br />

1654. doi:10.1016/j.neuropsychologia.2005.01.012<br />

Giese, M. A., & Poggio, T. (2003). Neural mechanisms for the recognition of biological<br />

movements. Nat Rev Neurosci, 4(3), 179-192. doi:10.1038/nrn1057<br />

Goodale, M. A., & Milner, A. D. (1992). Separate visual pathways for perception and action. Trends<br />

in Neurosciences, 15(1), 20-25.<br />

Haxby J. V., , Hoffman, E. A., & Gobbini, M. I. (2000). The distributed human neural system for<br />

face perception. Trends in Cognitive Sciences, 4(6), 223–233.<br />

Heberlein, A. S., Adolphs, Ralph, Tranel, D., & Damasio, H. (2004). Cortical regions for judgments<br />

of emotions and personality traits from point-light walkers. Journal of Cognitive<br />

Neuroscience, 16(7), 1143-1158. doi:10.1162/0898929041920423<br />

Jiang, Y., & He, S. (2006). Cortical Responses to Invisible Faces: Dissociating Subsystems for


Facial-Information Processing. Current Biology, 16(20), 2023-2029.<br />

doi:10.1016/j.cub.2006.08.084<br />

Kanwisher, N., & Yovel, G. (2006). The fusiform face area: a cortical region specialized for the<br />

perception of faces. Philosophical Transactions of the Royal Society of London. Series B,<br />

Biological Sciences, 361(1476), 2109–2128. doi:10.1098/rstb.2006.1934<br />

Kawabata, H., & Zeki, S. (2004). Neural correlates of beauty. Journal of Neurophysiology, 91(4),<br />

1699-1705. doi:10.1152/jn.00696.2003<br />

Kessler, H., Doyen-Waldecker, C., Hofer, C., Hoffmann, H., Traue, H. C., & Abler, B. (n.d.). Neural<br />

correlates of the perception of dynamic versus static facial expressions of emotion, 8.<br />

doi:10.3205/psm000072<br />

Killgore, W. D. S., & Yurgelun-Todd, D. A. (2004). Activation of the amygdala and anterior<br />

cingulate during nonconscious processing of sad versus happy faces. NeuroImage, 21(4),<br />

1215-1223. doi:10.1016/j.neuroimage.2003.12.033<br />

Kim, C. Y., & Blake, R. (2005). Psychophysical magic: rendering the visible invisible. Trends in<br />

Cognitive Sciences, 9(8), 381–388.<br />

Kim, H., Somerville, L. H., Johnstone, T., Alexander, A. L., & Whalen, Paul J. (2003). Inverse<br />

amygdala and medial prefrontal cortex responses to surprised faces. Neuroreport, 14(18),<br />

2317-2322. doi:10.1097/01.wnr.0000101520.44335.20<br />

Kouider, S., Berthet, V., & Faivre, N. (2011). Preference is biased by crowded facial expressions.<br />

Psychological Science: A Journal of the American Psychological Society / APS, 22(2), 184-<br />

189. doi:10.1177/0956797610396226<br />

Kouider, S., Eger, E., Dolan, R., & Henson, R. N. (2009). Activity in face-responsive brain regions<br />

is modulated by invisible, attended faces: evidence from masked priming. Cerebral Cortex<br />

(New York, N.Y.: 1991), 19(1), 13–23. doi:10.1093/cercor/bhn048<br />

Kveraga, K., Boshyan, J., & Bar, M. (2007). Magnocellular Projections as the Trigger of Top-Down<br />

Facilitation in Recognition. The Journal of Neuroscience, 27(48), 13232 -13240.


doi:10.1523/JNEUROSCI.3481-07.2007<br />

Lamme, V. A., & Roelfsema, P. R. (2000). The distinct modes of vision offered by feedforward and<br />

recurrent processing. Trends in Neurosciences, 23(11), 571-579.<br />

LeDoux, J. E. (1998). The Emotional Brain: The Mysterious Underpinnings of Emotional Life (US<br />

ed.). Simon & Schuster.<br />

Levi, D. M. (2008). Crowding–an essential bottleneck for object recognition: a mini-review. Vision<br />

Research, 48(5), 635–654. doi:10.1016/j.visres.2007.12.009<br />

Liddell, B. J., Williams, L. M., Rathjen, J., Shevrin, H., & Gordon, E. (2004). A temporal<br />

dissociation of subliminal versus supraliminal fear perception: an event-related potential<br />

study. J Cogn Neurosci, 16(3), 479–486. doi:10.1162/089892904322926809<br />

Lin, Z., He. (2009). Seeing the invisible: the scope and limits of unconscious processing in<br />

binocular rivalry. Progress in Neurobiology, 87(4), 195–211.<br />

doi:10.1016/j.pneurobio.2008.09.002<br />

Maldjian, J.A., Laurienti, P.J., Kraft, R.A., and Burdette, J.H. An automated method for<br />

neuroanatomic and cytoarchitectonic atlas-based interrogation of fMRI data sets,<br />

Neuroimage 19 (2003), pp. 1233–1239.<br />

Martelli M., Majaj N. J., Pelli D. G. (2005). Are faces processed like words A diagnostic test for<br />

recognition by parts. Journal of Vision, 5, (1):6, 58–70,<br />

Morris, J. S., Ohman, A, & Dolan, R J. (1998). Conscious and unconscious emotional learning in<br />

the human amygdala. Nature, 393(6684), 467-470. doi:10.1038/30976<br />

Morris, J. S., Ohman, A., & Dolan, R. J. (1999). A subcortical pathway to the right amygdala<br />

mediating « unseen » fear. Proc Natl Acad Sci U S A, 96(4), 1680–1685.<br />

Ohman, A., Carlsson, K., Lundqvist, D., & Ingvar, M. (2007). On the unconscious subcortical<br />

origin of human fear. Physiol Behav, 92(1-2), 180–185. doi:10.1016/j.physbeh.2007.05.057<br />

Pelli. (1997). The VideoToolbox software for visual psychophysics: transforming numbers into<br />

movies. Spatial Vision, 10(4), 437–442.


Pessoa, L., & Adolphs, R. (2010). Emotion processing and the amygdala: from a « low road » to<br />

« many roads » of evaluating biological significance. Nat Rev Neurosci, 11(11), 773–783.<br />

doi:10.1038/nrn2920<br />

Pessoa, L., Japee, S., Sturman, D., & Ungerleider, L. G. (2006). Target visibility and visual<br />

awareness modulate amygdala responses to fearful faces. Cerebral Cortex (New York, N.Y.:<br />

1991), 16(3), 366–375. doi:10.1093/cercor/bhi115<br />

Pitcher, D., Dilks, D. D., Saxe, R. R., Triantafyllou, C., & Kanwisher, N. (2011). Differential<br />

selectivity for dynamic versus static information in face selective cortical regions.<br />

NeuroImage, 56, 2356-2363.<br />

Puce, A., & Perrett, D. (2003). Electrophysiology and brain imaging of biological motion.<br />

Philosophical Transactions of the Royal Society B: Biological Sciences, 358(1431), 435-<br />

445. doi:10.1098/rstb.2002.1221<br />

Rolls, Edmund T, Critchley, H. D., Browning, A. S., & Inoue, K. (2006). Face-selective and<br />

auditory neurons in the primate orbitofrontal cortex. Experimental Brain Research.<br />

Experimentelle Hirnforschung. Expérimentation Cérébrale, 170(1), 74-87.<br />

doi:10.1007/s00221-005-0191-y<br />

Sah, P., Faber, E. S. L., Lopez De Armentia, M., & Power, J. (2003). The Amygdaloid Complex:<br />

Anatomy and Physiology. Physiological Reviews, 83(3), 803 -834.<br />

doi:10.1152/physrev.00002.2003<br />

Sato, W., Kochiyama, T., Yoshikawa, S., Naito, E., & Matsumura, M. (2004). Enhanced neural<br />

activity in response to dynamic facial expressions of emotion: an fMRI study. Brain Res<br />

Cogn Brain Res, 20(1), 81–91. doi:10.1016/j.cogbrainres.2004.01.008<br />

Saxe, R., Brett, M., & Kanwisher, N. (2006). Divide and conquer: A defense of functional<br />

localizers. NeuroImage, 30(4), 1088-1096. doi:10.1016/j.neuroimage.2005.12.062<br />

Schultz, J., & Pilz, K. S. (2009). Natural facial motion enhances cortical responses to faces.<br />

Experimental Brain Research. Experimentelle Hirnforschung. Experimentation Cerebrale,


194(3), 465-475. doi:10.1007/s00221-009-1721-9<br />

Tamietto, M., & Gelder, B. de. (2010). Neural bases of the non-conscious perception of emotional<br />

signals. Nat Rev Neurosci, 11(10), 697–709. doi:10.1038/nrn2889<br />

Thorpe, S. J., Rolls, E T, & Maddison, S. (1983). The orbitofrontal cortex: neuronal activity in the<br />

behaving monkey. Experimental Brain Research. Experimentelle Hirnforschung.<br />

Expérimentation Cérébrale, 49(1), 93-115.<br />

Trautmann, S. A., Fehr, T., & Herrmann, M. (2009). Emotions in motion: Dynamic compared to<br />

static facial expressions of disgust and happiness reveal more widespread emotion-specific<br />

activations. Brain Research, 1284, 100–115. doi:10.1016/j.brainres.2009.05.075<br />

Tsuchiya, N., Moradi, F., Felsen, C., Yamazaki, M., & Adolphs, R. (2009). Intact rapid detection of<br />

fearful faces in the absence of the amygdala. Nature Neuroscience, 12(10), 1224–1225.<br />

doi:10.1038/nn.2380<br />

Tzourio-Mazoyer N, Landeau B, Papathanassiou D, Crivello F, Etard O, Delcroix N, Mazoyer B,<br />

Joliot M. Automated anatomical labeling of activations in SPM using a macroscopic<br />

anatomical parcellation of the MNI MRI single-subject brain. Neuroimage, 15(1):273-89<br />

Whalen, P J, Rauch, S L, Etcoff, N. L., McInerney, S. C., Lee, M. B., & Jenike, M. A. (1998).<br />

Masked presentations of emotional facial expressions modulate amygdala activity without<br />

explicit knowledge. The Journal of Neuroscience: The Official Journal of the Society for<br />

Neuroscience, 18(1), 411-418.<br />

Williams, L. M., Liddell, B. J., Rathjen, J., Brown, K. J., Gray, J., Phillips, M., Young, A., et al.<br />

(2004). Mapping the time course of nonconscious and conscious perception of fear: an<br />

integration of central and peripheral measures. Hum Brain Mapp, 21(2), 64–74.<br />

doi:10.1002/hbm.10154<br />

Williams, M. A., Morris, A. P., McGlone, F., Abbott, D. F., & Mattingley, J. B. (2004). Amygdala<br />

Responses to Fearful and Happy Facial Expressions under Conditions of Binocular<br />

Suppression. J. Neurosci., 24(12), 2898-2904. doi:10.1523/JNEUROSCI.4977-03.2004


Winston, J. S., Vuilleumier, P., & Dolan, Raymond J. (2003). Effects of low-spatial frequency<br />

components of fearful faces on fusiform cortex activity. Curr Biol, 13(20), 1824–1829.<br />

Wright, C. I., Martis, B., Schwartz, C. E., Shin, L. M., Fischer, H. åkan, McMullin, K., & Rauch,<br />

Scott L. (2003). Novelty responses and differential effects of order in the amygdala,<br />

substantia innominata, and inferior temporal cortex. NeuroImage, 18(3), 660-669.<br />

doi:10.1016/S1053-8119(02)00037-X


5 Influences de la durée de stimulation<br />

et de l’accès conscient sur l’adaptation<br />

sensorielle<br />

Faivre, N., & Kouider, S. (in press). Increased Sensory Evidence Reverses<br />

Nonconscious Priming During Crowding. Journal of Vision.<br />

5.1 Présentation de l’étude<br />

Introduction<br />

Dans cette dernière étude, nous revenons à l’utilisation de l’adaptation sensorielle comme<br />

mesure indirecte du traitement non conscient d’information encombrée. A notre connaissance,<br />

les deux signatures de l’adaptation sensorielle, à savoir l’amorçage qui facilite le<br />

traitement d’une cible reliée, et l’habituation, qui l’inhibe, ont été utilisées indépendamment<br />

l’une de l’autre. Pourtant, les modèles expliquant ces phénomènes prédisent un<br />

pattern biphasique : au cours de sa présentation, l’amorce devrait d’abord induire des<br />

effets d’amorçage dont l’amplitude augmente jusqu’à un certain seuil, puis diminuant et<br />

s’inversant même pour donner lieu à de l’habituation si la durée d’exposition est trop<br />

prolongée (Gotts, 2003, thèse de doctorat non publiée).<br />

Une étude utilisant des stimuli visibles a modulé de manière systématique la durée d’exposition<br />

de l’amorce afin d’en mesurer les conséquences sur les effets amorçages (Zago<br />

et al., 2005). Les résultats ont suggéré un pattern en "montée et descente" (rise-and-fall),<br />

l’amplitude de l’amorçage augmentant pour atteindre un maximum après 250ms d’exposition,<br />

puis diminuant progressivement jusqu’à une valeur asymptotique. Aucune trace<br />

d’habituation n’a été mesurée aux durées employées. Nous avons posé l’hypothèse que<br />

de par l’utilisation de stimuli visibles, les mécanismes associés à l’accès conscient et/ou à<br />

147


CHAPITRE 5. INFLUENCES DE LA DURÉE DE STIMULATION ET DE L’ACCÈS CONSCIENT SUR<br />

L’ADAPTATION SENSORIELLE<br />

l’amplification attentionnelle étaient à même de contrecarrer les effets d’habituation intervenant<br />

à longue exposition. Nous avons donc testé cette hypothèse en tirant profit du<br />

GCC pour moduler de manière indépendante la durée de stimulation et l’accès conscient<br />

afin d’évaluer leur conséquence sur l’adaptation sensorielle.<br />

Ici, le propos n’étant pas de sonder la profondeur de l’inconscient cognitif mais plutôt de<br />

comparer des régimes de fonctionnement conscient et non conscient, nous avons choisi<br />

d’utiliser une tâche impliquant un traitement de l’information de bas niveau, à savoir<br />

l’orientation angulaire. Au préalable, pour chaque participant, nous mesurions à l’aide<br />

d’une procédure adaptative l’excentricité correspondant à son seuil de discriminabilité<br />

(c’est à dire l’excentricité pour laquelle les performances sur l’amorce orientée étaient<br />

statistiquement au niveau du hasard). Pendant l’expérience, chaque participant était<br />

ensuite exposé à une amorce périphérique orientée de courte (200ms) ou longue durée<br />

(1000ms), puis devait indiquer le plus rapidement possible l’orientation d’une cible ellemême<br />

orientée. Le type d’adaptation sensorielle était inféré en comparant les temps de<br />

réaction entre les essais dans lesquels amorce et cible partageaient la même orientation<br />

(essais reliés) et ceux dans lesquels ils étaient d’orientation opposée (essais non reliés). Les<br />

temps de réaction devaient alors être inférieurs dans les essais reliés en cas d’amorçage,<br />

et supérieurs en cas d’habituation. Nous avons également modulé l’accès conscient en<br />

manipulant le niveau d’encombrement de l’amorce.<br />

Principaux résultats<br />

Lorsque l’amorce était encombrée et donc indiscriminable, nous avons mesuré qu’elle induisait<br />

des effets facilitateurs (amorçage) lorsqu’elle était de courte durée, et inhibiteurs<br />

(habituation) lorsqu’elle était de longue durée. Comme nous l’avions postulé, la restauration<br />

de l’accès conscient à l’amorce par la présentation fovéale du stimulus ou par la<br />

réduction de son encombrement 1 a eu pour effet d’amplifier l’amplitude de l’amorçage,<br />

ainsi que d’annuler l’effet de l’habituation. Nous avons ensuite répliqué ces deux résultats<br />

au sein d’une même expérience. Placés juste au dessus du seuil de discriminabilité,<br />

les participants notaient à chaque essai la qualité de leur perception de l’amorce, puis<br />

les essais étaient regroupés selon trois classes de discriminabilité analysées séparément<br />

(basse, moyenne, et haute). A stimulation strictement égale, nous avons ainsi confirmé<br />

1. Nous avons pour cela diminué la similarité entre l’amorce et ses voisins, en présentant ces derniers<br />

de manière horizontale. Avec cette manipulation minimale, l’amorce faiblement orientée par rapport à<br />

la verticale échappait à l’encombrement et devenait ainsi aisément discriminable.<br />

148


CHAPITRE 5. INFLUENCES DE LA DURÉE DE STIMULATION ET DE L’ACCÈS CONSCIENT SUR<br />

L’ADAPTATION SENSORIELLE<br />

que les essais incluant des amorces non perçues donnaient lieu à de l’amorçage à exposition<br />

courte, et de l’habituation à exposition longue, alors que les essais incluant des<br />

amorces perçues donnaient lieu à un amorçage plus important à exposition courte, mais<br />

aucune trace d’habituation.<br />

Discussion<br />

Dans cette étude, nous avons d’une part répliqué le pattern en montée et descente de<br />

l’amorçage conscient. De plus, nous avons mis à jour un pattern en montée et inversion<br />

(rise-and-reverse) induit par des amorces non discriminables. Il semblerait donc que<br />

l’accès conscient à l’information retarde, ou empêche le renversement de l’amorçage en<br />

habituation. L’utilisation d’amorces et de cibles en contraste de phase a permis d’exclure<br />

une origine pré-corticale de ce phénomène, et de l’associer au traitement de l’orientation<br />

inauguré au sein du cortex visuel primaire. La modulation de l’accès conscient à stimulation<br />

égale exclut par ailleurs toute interprétation liée à la force du signal, et suggère<br />

plutôt une influence associée à l’accès conscient. Enfin, nous avons contrôlé que l’asynchronie<br />

d’apparition du stimulus (SOA) inhérente à la présentation longue de l’amorce<br />

n’était pas la cause de l’inversion de l’amorçage en habituation, puisqu’une amorce de<br />

courte durée avec long SOA ne donnait lieu à aucun effet, comme c’est souvent observé<br />

(Dupoux et al., 2008).<br />

Nous avons donc postulé que les mécanismes liés à l’accès conscient, et notamment la<br />

récurrence et la diffusion globale, ainsi que l’amplification attentionnelle étaient à même<br />

de retarder ou d’empêcher le renversement d’amorçage en habituation (voir section 1.3<br />

page 20). Ces résultats sont à mettre en parallèle à une étude de notre groupe, rapportant<br />

des phénomènes similaires avec l’amorçage de répétition de visages en CFS (Barbot &<br />

Kouider, sous presse), ainsi qu’à une autre étude rapportant une inversion d’influences<br />

sémantiques lors de la répétition de stimuli masqués (Wentura & Frings, 2005). Il semble<br />

donc qu’en l’absence d’accès conscient, l’inversion de l’amorçage en habituation soit un<br />

phénomène général, indépendant à la fois de la technique employée (GCC, CFS, masquage),<br />

et du niveau de stimuli traités (orientation angulaire, identité faciale, et même<br />

sens des mots).<br />

5.2 Article<br />

149


Increased Sensory Evidence Reverses Nonconscious Priming<br />

During Crowding<br />

Nathan Faivre & Sid Kouider<br />

Laboratoire de Sciences Cognitives et Psycholinguistique, CNRS/EHESS/DEC-ENS, Paris, France.<br />

Send correspondance to:<br />

Nathan Faivre, LSCP, Ecole Normale Supérieure, 29 rue d'Ulm, 75005 Paris, France.<br />

Phone: +33 1 44 32 26 25. E-mail: nathan.faivre@ens.fr<br />

Keywords : sensory adaptation, crowding, priming, perceptual awareness


Abstract<br />

Sensory adaptation reflects the fact that the responsiveness of a perceptual system changes after the<br />

processing of a specific stimulus. Two manifestations of this property have been used in order to<br />

infer the mechanisms underlying vision: on the one hand priming, in which the processing of a<br />

target is facilitated by prior exposure to a related adaptor, and on the other hand habituation, in<br />

which this processing is hurt by overexposure to an adaptor. In the present study, we investigated<br />

the link between priming and habituation by measuring how sensory evidence (i.e., short vs. long<br />

adaptor exposure) and perceptual awareness (i.e., discriminable vs. undiscriminable adaptor<br />

stimulus) affects the adaptive response on a related target. Relying on gaze-contingent crowding, we<br />

manipulated independently adaptor discriminability and adaptor duration, and inferred sensory<br />

adaptation from reaction times on the discrimination of a subsequent oriented target. When adaptor<br />

orientation was undiscriminable, we found that increasing its duration reversed priming into<br />

habituation. When adaptor orientation was discriminable, priming effects were larger after short<br />

exposure, but increasing adaptor duration led to a decrease of priming instead of a reverse into<br />

habituation. We discuss our results as reflecting a change in the temporal dynamics of angular<br />

orientation processing, depending on the mechanisms associated with perceptual awareness (e.g.,<br />

global broadcasting, neural reentrance) and attentional amplification.


Introduction<br />

Sensory adaptation is a general property of perceptual systems in which a change of<br />

responsiveness follows the processing of a specific stimulus (Webster, 2011). At the behavioral<br />

level, sensory adaptation is responsible for two phenomena with opposite consequences. The first<br />

one is a positive effect classically referred to as priming, and reflecting a facilitation when<br />

processing a target preceded by an adaptor stimulus sharing some physical (e.g., angular<br />

orientation) or conceptual (e.g., semantic) properties. The second one is referred to as sensory<br />

habituation (although it is often termed by using the generic term sensory adaptation in the<br />

psychophysics literature) and reflects, on the contrary, an inhibitory effect whereby overexposure to<br />

an adaptor hurts the processing of a related target. <strong>These</strong> two effects have been extensively used for<br />

probing the neural and cognitive processes underlying perception, by following the assumption that<br />

a given stimulus property is indeed processed whenever the system shows adaptive responses on a<br />

subsequent target sharing this property. Furthermore, this logic can be extended to the domain of<br />

nonconscious perception, as priming and habituation can be observed even when participants are<br />

not able to report the presence (chance-level detection) or the nature (chance-level discrimination)<br />

of the adaptor (see Kouider & Dehaene, 2007, for nonconscious priming during masking; see Lin &<br />

He, 2009, for nonconscious habituation during binocular rivalry).<br />

When stimuli are consciously visible, sensory adaptation occurs on multiple timescales,<br />

ranging from milliseconds to minutes, or even hours (see Kohn, 2007, for a review). Depending on<br />

the timescale, sensory adaptation may involve different mechanisms (Grill-Spector, Henson, &<br />

Martin, 2006). For instance, the facilitation model states that an adaptor facilitates the identification<br />

of a subsequent related target (i.e., priming effect) by improving the coding of the stimulus'<br />

features, notably through an increase in synaptic efficacy (i.e., synaptic potentiation). Another<br />

account suggests that instead of improving the coding of all stimulus' features, longer adaptor<br />

exposure induces the selection of diagnostic features only, while neurons coding features that are<br />

non-essential for its recognition stop responding (Desimone, 1996; Wiggs & Martin, 1998). The<br />

mechanism underlying this selection, or sharpening, may involve mechanisms such as lateral<br />

inhibition, whereby the neurons with the strongest initial response inhibit the rest of the population.<br />

Therefore, increasing adaptor exposure decreases the number of adaptor encoded features, which<br />

leads to a decrease of overlapping features between the adaptor and the target, and consequently, to<br />

a decrease of priming effects. Behavioral and neural evidences of priming seem to support the<br />

coexistence of both the facilitation and the selection accounts, by showing a “rise-and-fall” pattern,


with a first period (i.e. following 40 to 250 ms of adaptor exposure) in which priming increases, and<br />

a second period (i.e. following 350 to 1900 ms of adaptor exposure) in which it decreases (Zago,<br />

Fenske, Aminoff, & Bar, 2005). Thus, long adaptor exposure may first facilitate the information<br />

coding, and then induce a selection of its key features for sustained representation. Paradoxically,<br />

after overexposure to the adaptor, the mechanisms involved in priming may become too extreme,<br />

and together with neural fatigue, impair the processing of the related target and finally give rise to<br />

habituation (S. Gotts, unpublished PhD thesis). Thus, the dynamic change in responsiveness<br />

supported by distinct mechanisms is supposed to induce a shift from priming to habituation.<br />

However, deciphering the dynamics of sensory adaptation with visible stimuli might lead to<br />

potential confounds. Indeed, theories of consciousness state that perceptual awareness is associated<br />

with mechanisms responsible for sustaining perceptual information over time, for instance through<br />

neural broadcasting (Dehaene & Naccache, 2001), or through neural reentrance (Lamme &<br />

Roelfsema, 2000). Consequently, the rise-and-fall pattern previously observed might diverge from<br />

the substantial properties of sensory adaptation, the decay due to habituation being counteracted by<br />

the top-down amplifications mechanisms associated with perceptual awareness. Thus, we predicted<br />

that preventing perceptual awareness would lead to stronger habituation and actually lead to a<br />

switch from a facilitatory to an inhibitory effect when adaptor exposure is increased, in a kind of<br />

“rise-and-reverse” pattern of sensory adaptation.<br />

In this study, we focused on the link between priming and habituation, by studying how the<br />

strength of sensory signals (i.e., oriented gratings with short vs. long stimulus duration) affects<br />

conscious and nonconscious sensory adaptation. We relied on visual crowding, a perceptual caveat<br />

in peripheral vision that impairs the discrimination of a peripheral stimulus when it is surrounded by<br />

similar flankers (Levi, 2008). This approach offers two main advantages for addressing this issue.<br />

First, as long as foveal access to the adaptor is prevented, the strength of crowding does not depend<br />

on stimulus duration (Kooi, Toet, Tripathy, & Levi, 1994), which allows for the presentation of<br />

long-lasting stimuli remaining undiscriminable. In order to control for participants' oculomotor<br />

behavior, we relied on gaze-contingent crowding, which consists in monitoring gaze position with<br />

an eye-tracker, and substituting the peripheral adaptor by an irrelevant content as soon as<br />

participants stare outside a fixation position defined by instructions. Second, while a crowded<br />

stimulus appears as jumbled and its informative content remains inaccessible to conscious reports, it<br />

still induces sensory adaptation, both at the level of single feature stimuli (e.g., habitutation for line<br />

orientations, see He, Cavanagh, & Intriligator, 1996), multi-feature stimuli (e.g., priming for<br />

directional arrows, see Faivre & Kouider, 2011). Using gaze-contingent crowding with both


discriminable and undiscriminable stimuli, we assessed how stimulus duration modulated the<br />

conscious and nonconscious processing of line orientations. When perceptual awareness was<br />

prevented by crowding, we found that being exposed with short-lasting oriented adaptors (i.e.,<br />

200ms) had facilitatory effects on the processing of subsequent related targets (priming), while<br />

longer exposure (i.e., 1000ms) reflected, instead, inhibitory effects (habituation). Restoring<br />

perceptual awareness through psychophysical manipulations had a large facilitatory effect on target<br />

processing, as it increased priming and canceled habituation. Thus, while our results are similar to<br />

the rise-and-fall pattern previously observed during conscious priming, they suggest a reverse of<br />

priming into habituation under situations of perceptual unawareness. <strong>These</strong> results are discussed in<br />

light of neural and behavioral correlates of sensory adaptation and perceptual awareness.


General Method<br />

Participants. All observers were university students between 18 and 35 years old. They reported<br />

normal or corrected vision, and were paid for their participation. Thirteen observers participated in<br />

Experiment 1a, 12 in Experiment 1b, 11 in Experiment 2, 16 in Experiment 3, and 15 in Experiment<br />

4.<br />

Stimuli. All stimuli consisted in 1.2° x 1.2° Gabor patches (0.45 Michelson contrast; 2 cycles per<br />

degree). Six flanker patches were organized on a circular array surrounding the adaptor patch<br />

(centre to centre spacing: 1.3° between two flankers; 2.4° between one flanker and the adaptor).<br />

Adaptor and target patches were tilted either 5° to the right or left from vertical. In Experiment 1a,<br />

adaptor and target patches shared the same contrast phase. In all the other experiments, adaptor and<br />

target patches were presented in contrast counter-phase.<br />

Procedure and design.<br />

Threshold evaluation. Eccentricity between the adaptor and fixation location was fixed individually<br />

prior to the priming experiment with a Quest staircase procedure (Watson & Pelli, 1983), such as<br />

participant performed at chance level on the adaptor discrimination task (except in Experiment 3 in<br />

which eccentricity was fixed such as participants performed on the adaptor discrimination task with<br />

an accuracy of 60%). While participants gazed continuously at a fixation cross situated at the<br />

quarter top of the screen, they were first presented with a peripheral circular array of flanker patches<br />

for 200ms. While the flanker patches remained on screen, the adaptor appeared in the middle of the<br />

array for 1000ms.Then, both the flankers and the adaptor patches disappeared, while a question at<br />

fixation position relative to the adaptor orientation appeared (i.e., “Left?” or “Right?”). Participants<br />

were instructed to answer the question by yes or no, by pressing respectively a button with their<br />

right or left finger. The question remained on screen until a response was provided. The staircase<br />

determined after 70 trials the eccentricity value at which observers performed at chance level. All<br />

staircases were inspected, and a staircase was discarded and repeated if it had not properly<br />

converged within the maximum number of trials. Importantly, as soon as a participant ceased to<br />

gaze at a 5° by 5° area surrounding the fixation location, the tilted adaptor patch was substituted by<br />

a vertical patch during the next refresh cycle of the monitor screen. This gaze-contingent<br />

substitution procedure guaranteed that the tilt orientation information was never processed foveally.


Priming experiment. As in the threshold evaluation phase, participants were instructed to stare<br />

continuously at the fixation location materialized by the fixation cross. Each trial started by the<br />

apparition of the flanker patches at the predetermined eccentricity for 1000ms or 200ms, which<br />

remained on screen while the adaptor patch appeared respectively for 200ms (short duration<br />

condition) or 1000ms (long duration condition). Thus, taken as a whole, each trial had a constant<br />

duration, no matter adaptor duration. Following an inter-stimulus interval of 100ms, a target patch<br />

appeared for 200ms at the location previously occupied by the adaptor patch, and participants had<br />

to indicate, as fast as possible, whether it was tilted to the right (right button press) or to the left (left<br />

button press) from vertical. By contrast to the adaptor, the target was not surrounded by flankers,<br />

and thus was clearly discriminable (see figure 1). The long duration and short duration priming<br />

trials were intermixed randomly. In addition to the main task, an adaptor discrimination task similar<br />

to the one used for threshold evaluation was randomly administrated to the participants in 1 out of 3<br />

trials. In this case, instead of the target, a question relative to the adaptor orientation appeared at<br />

fixation position (i.e., “Left” or “Right”). The participant’s task was to decide whether the answer<br />

was yes (right button press) or no (left button press). Participants received a total of 60 adaptor<br />

discrimination trials randomly intermixed with 120 priming trials. Measuring visibility in<br />

alternation with priming presents two advantages. First, the visibility measure is consequently<br />

sensitive to potential changes in perceptual thresholds occurring during the experiment (e.g.,<br />

training or fatigue effects). Second, as participants never know which of the two tasks they will<br />

encounter, they must attend to the peripheral adaptor at each trial in case a visibility task occurs.<br />

This attentional amplification has been shown to maximise priming effects (Naccache, Blandin, &<br />

Dehaene, 2002; Faivre & Kouider, 2011). The gaze-contingent substitution was applied as for the<br />

threshold evaluation phase. Only trials for which gaze position was correct during 90% of total<br />

adaptor duration were analysed (i.e., 180ms in the short duration condition and 900ms in the long<br />

duration condition).<br />

Apparatus. Stimuli were displayed against a grey background by a 22-in. Iiyama Vision master pro<br />

510 monitor (luminance 15.7 cd/m²; frame rate 85 Hz; resolution 1024x768 pixels) with a computer<br />

running Matlab with the Psychophysics Toolbox (Brainard, 1997; Pelli, 1997). The participant sat<br />

57cm from the screen in a dimly lit room. A chin and headrest were used. Eye movements were<br />

recorded monocularly with a tower mounted eye tracker (Eyelink 1000 system, SR research,<br />

Ontario, Canada) controlled with the Eyelink toolbox (resolution: temporal 500 Hz; spatial > 1°).


Results<br />

Experiment 1<br />

In Experiment 1, we relied on the independence between stimulus duration and stimulus<br />

discriminability under crowding (Kooi et al., 1994), in order to measure the influence of adaptor<br />

duration on nonconscious sensory adaptation. Participants exposed to short and long-lasting<br />

oriented adaptors that remained undiscriminable were asked to indicate the orientation of<br />

subsequent target stimuli. Comparison of reaction times in related trials (i.e., in which adaptors and<br />

targets shared the same orientation) and unrelated trials (i.e., in which adaptors and targets had an<br />

opposite orientation) served as an index of sensory adaptation. In Experiment 1a, adaptors and<br />

targets shared the same contrast phase. In Experiment 1b, adaptors and targets were presented in<br />

contrast counter-phase. Since adaptors and targets appeared at the same location on the screen, we<br />

wanted to control with Experiment 1b that adaptation effects do not arise before any cortical<br />

processing, for instance from adaptation to local luminance changes at the level of the retina.<br />

Experiments 1a & 1b are analysed together, with contrast similarity (i.e., phasic stimuli in<br />

Experiment 1a and counter-phasic stimuli in Experiment 1b) as a between-subject factor.


Figure 1. Paradigm used in Experiment 1. Each trial started with the presentation of a fixation cross at the quarter top of<br />

the screen. At the bottom of the screen, with an eccentricity fixed individually, this was followed by the apparition of six<br />

flanker patches during 1000ms or 200ms. Afterward, the adaptor patch appeared in the middle of the flankers,<br />

respectively for 200ms (short duration condition) or 1000ms (long duration condition). Following an inter-stimulus<br />

interval of 100ms, participants were then presented either with a peripheral target on which they had to indicate the<br />

orientation, or with a question about the adaptor orientation to which they were forced to answer (Visibility Question).<br />

In Experiment 1a, adaptor and target patches shared the same contrast phase. In Experiment 1b, adaptor and target<br />

patches were presented in contrast counter-phase.<br />

Results and discussion.<br />

First, we determined with the threshold evaluation phase the eccentricity value at which observers<br />

performed at chance level (mean eccentricity = 17.38°, SD = 3.95). Then, in the priming<br />

experiment, data cleaning based on oculomotor behavior during adaptor exposure conserved<br />

91.44% of total trials (see General Method). Participants responded correctly on 82.70% of the<br />

remaining trials (SD = 12.51). Only correct responses were included in the reaction time analyses.<br />

We performed an ANOVA on reaction time, with participants as a random variable and relation and<br />

adaptor duration as main factors, and contrast similarity as a between-subject factor. We found a<br />

main effect of adaptor duration [F(1,23) = 11.63, p < 0.005], reflecting the fact that participants<br />

were faster to answer in the short duration compared to the long duration condition (28ms, SD =<br />

39.79). Importantly, we found an interaction between relation and adaptor duration [F(1,23) =<br />

63.31, p < 0.0001]. This signed the existence of a priming effect at short duration (i.e., participants<br />

were faster to indicate the target orientation when it was preceded by a related vs. unrelated adaptor,<br />

mean priming effect = 52ms, t(24) = 5.26, p < 0.0001), and an habituation effect at long duration


(participants were slower in related vs. unrelated trials, mean habituation effect = -37ms, t(24) =<br />

-3.81, p < 0.001) (see Figure 2). No significant interaction with contrast similarity was found (p ><br />

0.1).<br />

Debriefing the participants after the experiment revealed that none of them declared being able to<br />

identify the adaptors. However, while the adaptor discrimination task confirmed that performance<br />

was at chance-level in the long duration condition (mean d' = 0.09; t(24) = 0.56; p = 0.58), it<br />

differed slightly from chance-level in the short duration condition (mean d' = 0.35; t(24) = 2.62; p <<br />

0.05). This could indicate that in some trials, some participants might have been able to discriminate<br />

the orientation of short-lasting adaptors. In order to address this possibility, we relied on<br />

Greenwald’s regression method (Greenwald, Klinger, & Schuh, 1995) which revealed that priming<br />

extrapolated to null visibility was still significantly above chance (intercept = 44ms, p < 0.001).<br />

Furthermore, post-hoc comparisons revealed that the positive priming effect was significant both in<br />

Experiment 1a (31ms, t(12) = 3.29, p < 0.01) while adaptor discriminability was at chance (mean d'<br />

= 0.32; t(12) = 1.28; p = 0.23), and in Experiment 1b (74ms, t(11) = 4.71, p < 0.001) while visibility<br />

was above chance (mean d' = 0.38; t(11) = 4.80; p = 0.001). The higher visibility in Experiment 1b<br />

may explain the larger priming effect (74ms vs. 31ms). We come back to this issue in the<br />

discussion.<br />

Figure 2. Bar-plots of mean reaction times in Experiment 1a & 1b, in related trials in blue (i.e., same orientation shared<br />

by the adaptor and the target), versus unrelated trials in red (i.e., opposite orientation shared by the adaptor and the<br />

target). Error bars indicate the standard error of the mean.


Experiment 2<br />

We aimed at assessing with Experiment 2 that the pieces of evidence we accumulated regarding the<br />

reverse of priming into habituation was specific to nonconscious sensory adaptation. We designed<br />

this new experiment as an exact replicate of Experiment 1, with the exception that flanker patches<br />

were now presented with an horizontal orientation. Thus, the similarity between the peripheral<br />

adaptor (tilted +/- 5° from vertical) and flankers was greatly diminished, and crowding virtually<br />

absent (Andriessen & Bouma, 1976). According to the rise-and-fall pattern of conscious adaptation<br />

reported by Zago and colleagues (2005), we postulated that abolishing crowding would preserve the<br />

priming effects induced by short adaptor exposure, while it would decrease, or cancel the<br />

habituation effects induced by long adaptor exposure.<br />

Results and discussion.<br />

First, eccentricity threshold was evaluated such as each participant performed at chance level on the<br />

adaptor discrimination trial (mean eccentricity = 14.09°, SD = 3.67). Importantly, the eccentricity<br />

threshold was evaluated with vertical flankers, since the use of horizontal flankers would have led<br />

to greater eccentricity values, and thus to a confound between perceptual awareness and stimulus<br />

strength. In the priming experiment, data cleaning based on oculomotor behavior during adaptor<br />

exposure preserved 97.12% of total trials (see General Method). Participants mean accuracy was<br />

90.21% (SD = 8.97). We performed an ANOVA with participants as a random variable and adaptortarget<br />

relation and adaptor duration as main factors. As expected, we found an interaction between<br />

relation and duration [F(1,10) = 12.10; p < 0.01], revealing priming effect in the short duration<br />

condition (65ms; t(10) = 4.29; p < 0.01), while no effect was found in the long duration condition (-<br />

6ms; t(10) = -0.32; p = 0.76, compared to the significant negative effect of -37ms found in<br />

Experiment 1) (see figure 3). Here, as we diminished the strength of crowding, adaptor visibility<br />

increased both in the short duration (mean d' = 1.81; t(10) = 4.14; p < 0.01) and the long duration<br />

condition (mean d' = 2.22; t(10) = 5.04; p < 0.001), without any difference between the two (p =<br />

0.51).


Figure 3. Bar-plot of reaction times in related (in blue) versus unrelated trials (in red). In Experiment 2, flanker patches<br />

were oriented horizontally, such as crowding was significantly reduced. Error bars indicate the standard error of the<br />

mean.


Experiment 3<br />

Results from Experiment 1 revealed that the duration of adaptor exposure could determine the<br />

direction of nonconscious sensory adaptation (i.e., priming or habituation), resulting in a reverse<br />

pattern in which priming transforms into habituation. Yet, accordingly to other studies (Zago et al.,<br />

2005), we did not find such a reversal during conscious priming. In Experiment 3, we aimed at<br />

confirming this dissociation in a within-subject design, by contrasting conscious and nonconscious<br />

adaptation at constant stimulation. For this purpose, visual crowding offers an interesting perceptual<br />

phenomenon for assessing how stimulus awareness impacts on the switch from priming to<br />

habituation without any confound with signal strength. Indeed, on a trial by trial basis, perceptual<br />

awareness (i.e., stimulus discriminability) can vary while the strength of the visual signal remains<br />

equal. Thus, we measured sensory adaptation induced by short vs. long-lasting adaptors on each<br />

trial depending on a subjective adaptor discriminability rating provided by participants. This<br />

procedure insured a manipulation of perceptual awareness with a constant stimulation around the<br />

discrimination threshold.<br />

Procedure and design.<br />

Threshold evaluation. The eccentricity between fixation and adaptor position was set such as<br />

participants performed on the adaptor discrimination task with an accuracy of 60% (mean<br />

eccentricity = 14.56°, SD = 3.30). This performance level allowed us to obtain different visibility<br />

levels on a trial by trial basis while stimulation remained constant (see below).<br />

Priming experiment. Each trial started with the apparition of the peripheral flanker patches for<br />

200ms or 1000ms, to which was added the adaptor patch respectively for 1000ms (long duration<br />

condition) or 200ms (short duration condition). The gaze-contingent substitution was applied as in<br />

Experiment 1 & 2. After an inter-stimulus interval of 100ms, the target appeared at the location<br />

previously occupied by the adaptor. Participants had to indicate as fast as possible whether the<br />

target patch was tilted on the right (right button press) or on the left (left button press), within a<br />

delay of 1500ms. Then, they were asked to indicate their subjective level of visibility of the adaptor<br />

patch only, on a scale appearing at fixation location (32° x 0.12° horizontal bar). The scale<br />

comprised 20 grades, labeled “rien vu” (i.e., nothing seen) below the leftmost grade, and “visibilité<br />

maximale” (i.e., maximal visibility) below the rightmost grade. Participants moved a cursor on the<br />

scale with left and right button presses, and validated their response with space bar.


Pilot experiment. As a validation of the subjective visibility rating procedure we used in the priming<br />

experiment, we ran a pilot experiment with seven naive participants. For each of them, the 60%<br />

accuracy threshold was evaluated (mean eccentricity = 15.14°, SD = 2.48). Then, after being<br />

exposed to the crowded adaptor for 1000ms, they were first asked to answer to the visibility<br />

question related to the adaptor orientation (i.e., “Left” or “Right?”). This measure estimated<br />

objectively the adaptor discriminability. Then, they had to indicate their subjective level of visibility<br />

using the visibility scale. A strong correlation between the objective and subjective discriminability<br />

measures [adjusted R-squared = 0.76; p < 10e-6] confirmed that participants used the visibility<br />

scale accordingly to their objective performance. In order to analyse reaction times in the priming<br />

experiment, we binned trials in function of individual subjective visibility ratings into three<br />

different groups (de Gardelle, Kouider, & Sackur, 2010). The low visibility group comprised the<br />

15% of total trials for which the individual visibility ratings were the lowest. Objective<br />

discriminability measures in this group did not differ from zero (mean d' = -0.051; t(6) = -0.18; p =<br />

0.86). The high visibility group comprised the 15% of total trials for which the individual visibility<br />

ratings were the highest. Objective discriminability measures in this group was high (mean d' = 3.6;<br />

t(6) = 7.02; p < 0.001). Finally, the medium visibility group comprised all the other trials (mean d' =<br />

2.21; t(6) = 5.92; p < 0.01). The same classification was used in the priming experiment.<br />

Results and discussion.<br />

Based on the validation provided by the pilot experiment, we binned trials individually for each<br />

participant in a low visibility group (comprising the 15% trials with the lowest visibility ratings), a<br />

high visibility group (comprising the 15% trials with the highest visibility ratings) and a medium<br />

visibility group (comprising all the other trials) (see figure 4).


Figure 4. Density estimate of subjective visibility rating in Experiment 3. Full white line represents the boundaries<br />

between low, medium and high visibility groups averaged across all participants (dashed lines represent two standard<br />

deviations around the mean).<br />

After the data cleaning based on oculomotor behavior, 84.56% of total trials were analysed (see<br />

General Method). Participants responded correctly on 86.68% of the remaining trials (SD = 6.65).<br />

Only correct responses were included in reaction time analyses. We performed an ANOVA with<br />

participants as a random variable and adaptor-target relation and adaptor duration as main factors.<br />

We found a main effect of relation, with shorter reaction times in related vs. unrelated trials [21ms;<br />

F(1,15) = 10.19; p < 0.01], as well as a main effect of adaptor duration, with shorter reaction times<br />

in the short vs. the long duration condition [26ms; F(1,15) = 17.41; p < 0.001]. Again, we found an<br />

interaction between relation and duration [F(1,15) = 20.63; p < 0.001], showing a priming effect in<br />

the short duration condition (53ms; t(15) = 4.89; p < 0.01), while the habituation effect for long<br />

duration condition did not reach significance (-11ms; p > 0.1). Analysing effects of sensory<br />

adaptation depending on adaptor visibility revealed that in the short duration condition, the priming<br />

effect increased with adaptor visibility, while in the long duration condition, the habituation effect<br />

was significant at low visibility, and was abolished as soon as the adaptor became visible (see figure<br />

5 & table 1) Finally, regarding subjective discriminability, an ANOVA with participants as random<br />

variable revealed that neither adaptor-target relation nor adaptor duration influenced adaptor<br />

discriminability (both p > 0.1). To sum up, relying on subjective measures of discriminability with


constant stimulation and a within-subject design, Experiment 3 confirmed that the directionality of<br />

sensory adaptation (i.e., priming or habituation) depended both on perceptual awareness and<br />

adaptor duration. When perceptual awareness was absent, we found evidences for the reverse of<br />

priming into habituation, although the priming effect induced by short-lasting stimuli did not reach<br />

significance. In comparison to the other experiments, each trial here requested the participant to<br />

realise one task on the target followed by another task on the adaptor. This combination might have<br />

changed the participants strategy and therefore disrupted the priming effect. Nonetheless, the effect<br />

amplitude (i.e., 26ms) was similar to what we found in the other experiments, and it remains<br />

possible that the analysis we performed based on subjective visibility grouping simply lacked<br />

statistical power. Finally, when perceptual awareness was present, the decay of priming we found is<br />

similar to the rise-and-fall pattern previously observed during object priming (Zago et al., 2005).<br />

Mechanistic interpretation of this pattern supports the succession of facilitation and selection. First,<br />

the processing of all stimulus features is facilitated, which explains the origin of priming effects.<br />

After longer exposure, only diagnostic features of the adaptor stimulus remain encoded, which<br />

decreases the similarity between the adaptor and the target, and induces the decay of priming effects<br />

(Wiggs & Martin, 1998).<br />

Figure 5. Mean adaptation effects in Experiment 3, depending on adaptor duration (short duration in blue, long duration<br />

in red) and adaptor discriminability (low, medium and high discriminability). Error bars indicate the standard error of<br />

the mean.


Low visibility Medium visibility High visibility<br />

Short duration 26 (p = 0.29) 51 (p < 0.001) 83 (p < 0.001)<br />

Long duration -35 (p < 0.05) 0 (p = 0.96) 1 (p = 0.96)<br />

Table 1. Priming effects (ms) depending on adaptor duration and adaptor visibility.<br />

Experiment 4<br />

In Experiment 1, we found that short and long-lasting adaptors respectively gave rise to priming<br />

(i.e., shortening of related targets processing) and habituation (i.e., slowing of related targets<br />

processing). However, short and long exposures differed not only regarding stimulus duration, but<br />

also regarding stimulus onset asynchrony (SOA) between adaptors and targets. Indeed, in the long<br />

duration condition, the SOA was 1100ms (i.e., 1000ms of adaptor exposure and 100ms of interstimulus<br />

interval), while the SOA in the short duration condition was 300ms (i.e., 200ms of adaptor<br />

exposure and 100ms of inter-stimulus interval). In order to control that the SOA difference was not<br />

at the origin of the reverse pattern of nonconscious sensory adaptation we found so far, we designed<br />

Experiment 4, in which participants were exposed with a short-lasting adaptor (200ms) preceding<br />

the target either with a short (300ms) or long SOA (1100ms).<br />

Procedure and design.<br />

Priming experiment. On each trial, flanker patches were presented peripherally during 1200ms. In<br />

the short SOA condition, the adaptor patch appeared 1000ms after the flankers' onset (i.e., 300ms<br />

before the target). Thus, this condition respected the exact same timing than the short duration<br />

condition in Experiment 1. In the long SOA condition, the adaptor patch appeared 200ms after the<br />

flankers' onset (i.e., 1100ms before the target). The short and long SOA conditions were intermixed<br />

randomly. Participants received a total of 60 adaptor discrimination trials randomly intermixed with<br />

120 priming trials. The gaze-contingent substitution was applied as in Experiment 1.


Results and discussion.<br />

First, as in Experiment 1, eccentricity threshold was evaluated such as each participant performed at<br />

chance level on the adaptor discrimination trial (mean eccentricity = 16.2°, SD = 3.93). After gazecontingent<br />

control, 92.00% of total trials were analysed. Participants performed correctly on<br />

86.98% (SD = 8.68). The ANOVA analysis revealed a main effect of relation [F(1,14) = 8.36, p <<br />

0.05], and only a marginal interaction between relation and SOA [F(1,14) = 3.19, p < 0.1]. This<br />

revealed a priming effect in the short SOA condition (45ms, t(14) = 3.06, p < 0.01), and no effect<br />

in the long SOA condition (12ms, t(14) < 1) (see Figure 6). One can note that if anything, the trend<br />

for positive rather than negative priming in the long SOA condition. The fact that nonconscious<br />

priming decreases very rapidly across time is coherent with the literature on nonconscious priming<br />

(Ferrand, 1996; Dupoux, de Gardelle & Kouider, 2008). Here, what is crucial is that long SOA is<br />

not a factor explaining the habituation effect we found with long adaptor exposure in Experiment 1.<br />

Regarding now adaptor discriminability, we found chance-level performance both in the short SOA<br />

condition (mean d' = 0.21; t(14) = 1.48; p = 0.16), and in the long SOA condition (mean d' = -0.004;<br />

t(14) = -0.02; p = 0.98), without any difference between the two conditions (t(14) = 1.26, p = 0.23).<br />

Thus, this result consists in a good replication of the priming effect we found in Experiment 1, this<br />

time with both counter-phase stimuli and null visibility.<br />

Figure 6. Barplot of mean reaction times in related (in blue) versus unrelated trials (in red) in Experiment 4. Error bars<br />

indicate the standard error of the mean.


General discussion<br />

So far, the majority of studies on conscious and nonconscious perception have relied on<br />

inferences from priming and habituation taken separately. Consequently, little is known regarding<br />

the links between these two phenomena. By manipulating independently stimulus duration and<br />

stimulus discriminability through crowding, the four experiments presented in this study bring new<br />

insights regarding the influences of sensory evidence and perceptual awareness on sensory<br />

adaptation.<br />

Nonconscious sensory adaptation.<br />

We found that despite being undiscriminable, short-lasting adaptors induced facilitatory<br />

effects, both when adaptors and targets shared the same contrast phase (Experiment 1a) and when<br />

they were presented in contrast counter-phase (Experiment 1b and Experiment 4 in short SOA<br />

condition). <strong>These</strong> typical priming effects reflect that line orientation is processed during crowding, a<br />

phenomenon which is now well described (He et al., 1996; Parkes, Lund, Angelucci, Solomon, &<br />

Morgan, 2001; Montaser-Kouhsari & Rajimehr, 2005). The reaction time measure we used here to<br />

unveil this phenomenon is interesting as it extends the perceptual threshold measures usually<br />

employed. Now regarding long adaptor exposures, we found habituation effects, here also both<br />

when adaptors and targets shared the same contrast phase (Experiment 1a) and when they were<br />

presented in counter phase (Experiment 1b). In Experiment 4, we controlled that the long SOA<br />

resulting from long adaptor exposure was not at the origin of habituation, as short adaptor exposure<br />

with long SOA did not give rise to any trend towards an habituation effect. Thus, it seems that<br />

overstimulating the system in the absence of perceptual awareness has a cost in terms of<br />

responsiveness, as revealed by sensory habituation.<br />

Taken together, priming after short adaptor exposure and habituation after long adaptor<br />

exposure suggest a facilitation-suppression pattern during nonconscious sensory adaptation. This<br />

finding is supported by two other studies probing different levels of nonconscious visual processing<br />

through different techniques. The first one relied on visual masking, whereby a very short lasting<br />

stimulus preceded and followed by mask patterns remains impossible to detect (see Kouider &<br />

Dehaene, 2007, for a review). It has been shown that increasing the repetition number of a masked<br />

adaptor word, and thus its cumulated duration, induced a switch from positive to negative<br />

influences during semantic priming (Wentura & Frings, 2005). The second one is a recent study<br />

from our group relying on continuous flash suppression, a variant of binocular rivalry in which


conscious perception of the stimulus in one eye is suppressed when the other eye receives dynamic<br />

contour-rich flashes (Barbot & Kouider, in press). Relying on a face repetition priming paradigm in<br />

which participants had to indicate whether a target face was familiar or unknown, this study<br />

revealed that face processing was facilitated by prior exposure to short-lasting adaptors (i.e.,<br />

reaction times decreased), while it was hurt by overexposure to long-lasting adaptors (i.e., reaction<br />

times increased). Here, each pair of adaptor and target was either constituted by identical faces, or<br />

different faces belonging to the same fame category (i.e., they were both famous or both unknown).<br />

Thus, as the task involved a fame judgment, the motor responses triggered by the adaptor and the<br />

target mapped onto the same hand response in related and unrelated trials. Consequently, the<br />

differences in terms of priming or habituation observed when comparing related and unrelated trials<br />

can not arise from motor facilitation and motor inhibition (see Eimer & Schlaghecken, 2003, for a<br />

review). In our study however, related trials involved congruent motor activations (e.g., a left<br />

oriented adaptor followed by a left oriented target), while unrelated trials involved incongruent<br />

sequences (e.g., left oriented adaptor followed by a right oriented target). Thus, replicating our<br />

findings with estimations of perceptual threshold instead of motor responses (i.e., reaction times)<br />

would discard a potential motor origin of the nonconscious overstimulation cost.<br />

Altogether, these results comfort the existence of a nonconscious overstimulation cost,<br />

independently of the hierarchical level of processing (i.e., semantic, facial identity, or line<br />

orientation in our case) and regardless of the technique employed to prevent perceptual awareness<br />

(i.e., visual masking, binocular rivalry, or gaze-contingent crowding in our case). In consequence,<br />

stimulus duration seems to be a property that influences neural responsiveness when perceptual<br />

awareness is prevented. This comforts the idea that nonconscious cognition is not limited to a sum<br />

of ‘snapshots’ independent the one from each other, but is able integrate over time informative<br />

signals present in the optic flow (VanRullen & Koch, 2003). Further parametric experiments with<br />

higher temporal resolution would be necessary in order to describe more accurately this pattern.


Conscious sensory adaptation<br />

Gaze-contingent crowding allowed for the modulation of adaptor discriminability while<br />

maintaining stimulus strength unchanged. Consequently, we were able to make post-hoc<br />

comparisons regarding the amplitude of conscious and nonconscious sensory adaptation. In order to<br />

increase statistical power, we merged together results obtained from similar conditions across<br />

several experiments. First regarding nonconscious priming, we merged results from Experiment 1a<br />

(in which short-lasting adaptor discriminability was at chance) with results from the lowest<br />

visibility group of Experiment 3 (in which participants rated the short-lasting adaptor as not<br />

perceived). Regarding conscious priming, we merged results from Experiment 2 (in which shortlasting<br />

adaptor discriminability was above chance due to the presence of horizontal flankers) with<br />

results from the highest visibility group of Experiment 3 (in which participants rated the shortlasting<br />

adaptor as perceived). Comparing these two sets of data, we found that priming effects were<br />

significantly larger in the conscious compared to the nonconscious situation (74ms versus 29ms, t =<br />

2.38, p < 0.02). Furthermore, in Experiment 1b, in which adaptor discriminability happened to be<br />

slightly above chance, we observed the same priming effect amplification in comparison to<br />

Experiment 1a (74ms versus 31ms, t = 2.33, p < 0.05) 1 . This argues for the idea that perceptual<br />

awareness is associated with an amplification of priming, a phenomenon which was previously<br />

reported both at the behavioral (Kouider & Dehaene, 2009) and at the neural level (Kouider,<br />

Dehaene, Jobert & Le Bihan, 2007). Along this line, the fact that crowding decreases the amplitude<br />

of orientation priming implies that it decreases the coding efficiency of angular orientation. Thus, at<br />

the neural level, it suggests that crowding arises at the site were angular orientation is encoded,<br />

starting from the primary visual cortex up to area V4 (see Bi, Cai, Zhou, & Fang, 2009; Fang,<br />

Murray, Kersten, & He, 2005; Gardner et al., 2005).<br />

Another factor that might explain the lower amplitude of orientation priming in the presence of<br />

crowding is the participants' ability to deploy covertly spatial attention on the peripheral adaptor.<br />

Indeed, it has been proposed that crowding reflects a coarsening of spatial attentional resolution in<br />

the periphery of the visual field (Intriligator & Cavanagh, 2001). Thus, crowding may reduce the<br />

capacity to amplify attentionally the signal from the adaptor, and consequently decrease its priming<br />

influence. Fitting with this view, previous results using gaze-contingent crowding showed that<br />

reducing attentional amplification to crowded symbols (i.e., undiscriminable arrows) by exerting an<br />

attentional load decreases their priming influences (Faivre & Kouider, 2011).<br />

1Note however that within an experiment, no correlation between priming and adaptor visibility was found.


Regarding now the condition with long adaptor exposure, we compared nonconscious and<br />

conscious habituation following the same post-hoc analysis strategy. First, regarding nonconscious<br />

habituation, we merged results from Experiment 1a (in which long-lasting adaptor discriminability<br />

was at chance) with results from the lowest visibility group of Experiment 3 (in which participants<br />

rated the long-lasting adaptor as not perceived). Regarding conscious habituation, we merged<br />

results from Experiment 2 (in which long-lasting adaptor discriminability was above chance due to<br />

the presence of horizontal flankers) with results from the highest visibility group of Experiment 3<br />

(in which participants rated the long-lasting adaptor as perceived). We found that restoring<br />

perceptual awareness cancelled the habituation effect we obtained in the nonconscious situation<br />

(i.e., -39ms versus -2ms, t = 2.59, p < 0.02). This suggests a negative relationship between sensory<br />

habituation and perceptual awareness, since the amplitude of habituation effects decreases with<br />

adaptor discriminability.<br />

The results we report concerning the influence of crowding on sensory habituation come within the<br />

scope of a recent debate. On the one hand, one study reported that long-lasting adaptors surrounded<br />

by high-contrast flanker patches induced less habituation than when surrounded by low-contrast<br />

flanker patches (Blake, Tadin, Sobel, Raissian, & Chong, 2006). This result suggests that crowding<br />

weakens the influence of long-lasting stimuli on orientation habituation. On the other hand, other<br />

studies using long-lasting adaptors in the presence or in the absence of flanker patches reported that<br />

crowding has no impact on the amplitude of orientation habituation (He et al., 1996; Bi et al., 2009).<br />

<strong>These</strong> results are at odd with the ones we report, since we found that habituation was present only<br />

when perceptual awareness was prevented by crowding. Several differences between our study and<br />

the others cited might explain such a discrepancy. First, the studies by Blake et al. (2006), He et al.<br />

(1996), and Bi et al. (2009) measured habituation through estimations of perceptual thresholds,<br />

while we relied on reaction time measures. Secondly, all these studies compared the influence of<br />

crowding on sensory habituation while manipulating the signal strength (i.e., contrast, or presence<br />

of flankers), while in our case, the comparisons between nonconscious (i.e., crowded) and<br />

conscious habituation (i.e., less, or not crowded) was realized at constant stimulation. Furthermore,<br />

in the study by Blake and colleagues, the adaptor was presented during 5s, while it flickered in<br />

counter-phase with the flankers at 1 Hz in order to prevent Troxler's fading. In the study by Bi and<br />

colleagues, the adaptor was presented during 3s, while it flickered in counter-phase with the<br />

flankers at 2Hz. In our case, no flickering was applied since no Troxler's fading occurred at the<br />

exposure duration we used (1000ms). The roles of stimulus constancy and stimulus duration during<br />

sensory habituation remain to be tested. Finally, is of note that all the studies we refereed to relied<br />

on long-lasting stimulation, and thus reported habituation without considering priming effects.


A possible mechanism for the anti-correlation between sensory habituation and perceptual<br />

awareness is that when the adaptor becomes visible, participants are able to compensate for any<br />

influence that is perceived to be distracting or detrimental to task performance. Typically, this is the<br />

case in unrelated trials, in which the adaptor is orthogonal to the target. A prediction made by this<br />

account is that increasing the proportion of related compared to unrelated trials should restore the<br />

conscious habituation effects, as participants would not repress the influences from highly<br />

predictive adaptors. Using fMRI, a recent study showed that repetition suppression was reduced<br />

when stimulus repetitions were improbable, suggesting the involvement of top-down strategies<br />

during sensory adaptation (Summerfield, Trittschuh, Monti, Mesulam, & Egner, 2008;<br />

Kaliukhovich & Vogels, 2011). We could argue that the repression of short-lasting visible adaptors<br />

should also disrupt the priming effects they induce. Yet, with a duration of only 200ms, the time<br />

necessary to develop intentionally this strategy might be insufficient, explaining why no repression<br />

occurs.<br />

Another explanation for our results on priming and habituation is, as stated in the<br />

introduction, the change of neural regime depending on perceptual awareness. Indeed, several<br />

theoretical arguments suggest that the processing of angular orientation leading to priming and<br />

habituation might have two different times courses depending on the adaptor discriminability. First,<br />

compared to nonconscious perception which primarily involves feed-forward activity sweeping<br />

from the sensory cortex up to higher regions, perceptual awareness involves feed-back activity from<br />

fronto-parietal regions down to sensory cortex (Lamme & Roelfsema, 2000; Dehaene et al., 2006).<br />

Reentrance has been showed to modify many neural sensory processes, among which neural tuning<br />

(Ringach, Hawken, & Shapley, 1997). According to the tuning account of priming (Desimone,<br />

1996) sharpening stimulus encoding by reentrance is likely to increase priming effects. Secondly, it<br />

is known that perceptual awareness is associated to a maintenance of information through top-down<br />

amplification, once the neural inputs enter into a global workspace consisting in distributed longdistance<br />

brain networks linking visual cortex to fronto-parietal regions (Dehaene & Naccache,<br />

2001). On the one hand, this maintenance is likely to preserve the positive influence of short-lasting<br />

stimuli on related targets even in condition of long SOA. On the other hand, this maintenance is<br />

likely to counteract or delay the occurrence of sensory habituation arising from long-lasting stimuli.<br />

Furthermore, as for perceptual awareness, attentional amplification is a plausible mechanism<br />

counteracting the occurrence of sensory habituation, as it decreases the strength of after-images<br />

induced by prolonged stimulus exposure (Suzuki & Grabowecky, 2003). One prediction arising<br />

from this hypothesis is that an experimental condition using long-lasting visible stimuli under a<br />

strong attentional load should restore the negative effects we found with invisible stimuli. However,


attentional load is also known to reduce the level of habituation induced by undiscriminable stimuli<br />

(Bahrami et al., 2008; Montaser-Kouhsari & Rajimehr, 2005). Experiments manipulating both the<br />

discriminability and the attentional amplification of long lasting stimuli will be necessary to<br />

disentangle the interaction of perceptual awareness and attention during sensory habituation.<br />

Additionally, further experiments with a finer range of stimulation duration will be necessary in<br />

order to assess whether our results reflect a change in the properties of sensory adaptation, or more<br />

generally a shift in the temporal dynamics of conscious and nonconscious processing.<br />

Conclusion.<br />

Relying on gaze-contingent crowding, we measured sensory adaptation induced by short vs.<br />

long-lasting stimuli. When perceptual awareness was prevented, we found an increase in visual<br />

responsiveness after brief stimulus exposure (priming), which reversed into a decrease in visual<br />

responsiveness after longer stimulus exposure (habituation). In the presence of perceptual<br />

awareness, priming associated with brief stimulus exposure was amplified, while habituation<br />

associated with longer stimulus exposure was cancelled. We proposed that the mechanisms<br />

associated with perceptual awareness and attentional amplification are at the origin of the<br />

amplification of priming, and the prevention of sensory habituation.<br />

Acknowledgments.<br />

The authors thank Paul Roux for helpful comments on the manuscript, and Virginie Delmas and<br />

Isabelle Brunet for technical assistance. This work was supported by a grant from the French<br />

ministry for higher education and research to NF, and an REI (Recherche Exploratoire et<br />

Innovation) and an ERC (European Research Council) starting grant to SK.


Bibliography.<br />

Andriessen, J. J., & Bouma, H. (1976). Eccentric vision: adverse interactions between line<br />

segments. Vision Research, 16(1), 71-78.<br />

Bahrami, B., Carmel, D., Walsh, V., Rees, G., & Lavie, N. (2008). Unconscious orientation<br />

processing depends on perceptual load. Journal of Vision, 8(3):12, 1–10,<br />

http://journalofvision.org/8/3/12/, doi:10.1167/8.3.12.<br />

Bi, T., Cai, P., Zhou, T., & Fang, F. (2009). The effect of crowding on orientation-selective<br />

adaptation in human early visual cortex. Journal of Vision, 9(11):13, 1–10,<br />

http://journalofvision.org/9/11/13/, doi:10.1167/9.11.13.<br />

Blake, R., Tadin, D., Sobel, K. V., Raissian, T. A., & Chong, S. C. (2006). Strength of early visual<br />

adaptation depends on visual awareness. Proceedings of the National Academy of Sciences<br />

of the United States of America, 103(12), 4783 -4788. doi:10.1073/pnas.0509634103.<br />

Brainard, D. H. (1997). The psychophysics toolbox. Spatial Vision, 10(4), 433–436.<br />

de Gardelle, V., Kouider, S., & Sackur, J. (2010). An oblique illusion modulated by visibility: Nonmonotonic<br />

sensory integration in orientation processing. Journal of Vision, 10(10):6, 1–9,<br />

http://www.journalofvision.org/content/10/10/6, doi:10.1167/10.10.6.<br />

Dehaene, S., & Naccache, L. (2001). Towards a cognitive neuroscience of consciousness: basic<br />

evidence and a workspace framework. Cognition, 79(1-2), 1–37.<br />

Desimone, R. (1996). Neural mechanisms for visual memory and their role in attention.<br />

Proceedings of the National Academy of Sciences of the United States of America, 93(24),<br />

13494-13499.<br />

Dupoux, E., de Gardelle, V., & Kouider, S. (2008). Subliminal speech perception and auditory<br />

streaming. Cognition,109(2), 267–273.<br />

Eimer, M., & Schlaghecken, F. (2003). Response facilitation and inhibition in subliminal priming.<br />

Psychonomic Bulletin & Review, 64, 7-26.<br />

Faivre, N., & Kouider, S. (2011). Multi-feature objects elicit nonconscious priming despite<br />

crowding. Journal of Vision, 11(3):2, 1–10, http://www.journalofvision.org/content/11/3/2,<br />

doi:10.1167/11.3.2.<br />

Fang, F., Murray, S. O., Kersten, D., & He, S. (2005). Orientation-tuned FMRI adaptation in human<br />

visual cortex. Journal of Neurophysiology, 94(6), 4188-4195. doi:10.1152/jn.00378.2005.<br />

Ferrand, L. (1996). The masked repetition priming effect dissipates when increasing the<br />

interstimulus interval: Evidence from word naming. Acta Psychologica, 91, 15–25.<br />

Gardner, J. L., Sun, P., Waggoner, R. A., Ueno, K., Tanaka, K., & Cheng, K. (2005). Contrast


adaptation and representation in human early visual cortex. Neuron, 47(4), 607-620.<br />

doi:10.1016/j.neuron.2005.07.016.<br />

Gotts, S. (2003). Mechanisms underlying enhanced processing efficiency in neural systems.<br />

Unpublished PhD thesis, Carnegie Mellon University, Pittsburgh, PA.<br />

Greenwald, A. G., Klinger, M. R., & Schuh, E. S. (1995). Activation by marginally perceptible<br />

(“subliminal”) stimuli: dissociation of unconscious from conscious cognition. Journal of<br />

Experimental Psychology. General, 124(1), 22-42.<br />

Grill-Spector K., Henson R., Martin A. (2006). Repetition and the brain: neural models of stimulusspecific<br />

effects. Trends in Cognitive Sciences 10(1):14-23.<br />

He, S., Cavanagh, P., & Intriligator, J. (1996). Attentional resolution and the locus of visual<br />

awareness. Nature, 383(6598), 334–337. doi:10.1038/383334a0.<br />

Intriligator, J., & Cavanagh, P. (2001). The spatial resolution of visual attention. Cognitive<br />

Psychology, 43, 171–216.<br />

Kaliukhovich, D. A., & Vogels, R. (2011). Stimulus repetition probability does not affect repetition<br />

suppression in macaque inferior temporal cortex. Cerebral Cortex, 21(7), 1547-1558.<br />

doi:10.1093/cercor/bhq207.<br />

Kohn, A. (2007). Visual adaptation: physiology, mechanisms, and functional benefits. Journal of<br />

Neurophysiology, 97(5), 3155 -3164. doi:10.1152/jn.00086.2007.<br />

Kooi, F. L., Toet, A., Tripathy, S. P., & Levi, D. M. (1994). The effect of similarity and duration on<br />

spatial interaction in peripheral vision. Spatial Vision, 8(2), 255-279.<br />

Kouider, S., & Dehaene, S. (2007). Levels of processing during non-conscious perception: a critical<br />

review of visual masking. Philosophical Transactions of the Royal Society of London. Series<br />

B, Biological Sciences, 362(1481), 857–875. doi:10.1098/rstb.2007.2093.<br />

Kouider, S., Berthet, V., & Faivre, N. (2011). Preference is biased by crowded facial expressions.<br />

Psychological Science, 22(2), 184-189. doi:10.1177/0956797610396226.<br />

Lamme, V. A., & Roelfsema, P. R. (2000). The distinct modes of vision offered by feedforward and<br />

recurrent processing. Trends in Neurosciences, 23(11), 571-579.<br />

Levi, D. M. (2008). Crowding–an essential bottleneck for object recognition: a mini-review. Vision<br />

Research, 48(5), 635–654. doi:10.1016/j.visres.2007.12.009.<br />

Lin, Z., & He, S. (2009). Seeing the invisible: the scope and limits of unconscious processing in<br />

binocular rivalry. Progress in Neurobiology, 87(4), 195–211<br />

doi:10.1016/j.pneurobio.2008.09.002.<br />

Montaser-Kouhsari, L., & Rajimehr, R. (2005). Subliminal attentional modulation in crowding<br />

condition. Vision Research, 45(7), 839–844.<br />

Naccache, L., Blandin, E., & Dehaene, S. (2002). Unconscious masked priming depends on


temporal attention. Psychological Science, 13(5), 416-424.<br />

Parkes, L., Lund, J., Angelucci, A., Solomon, J. A., & Morgan, M. (2001). Compulsory averaging of<br />

crowded orientation signals in human vision. Nature Neuroscience, 4(7), 739–744.<br />

Pelli. (1997). The VideoToolbox software for visual psychophysics: transforming numbers into<br />

movies. Spatial Vision, 10(4), 437–442.<br />

Ringach, D. L., Hawken, M. J., & Shapley, R. (1997). Dynamics of orientation tuning in macaque<br />

primary visual cortex. Nature, 387(6630), 281-284. doi:10.1038/387281a0.<br />

Summerfield, C., Trittschuh, E. H., Monti, J. M., Mesulam, M. M., & Egner, T. (2008). Neural<br />

repetition suppression reflects fulfilled perceptual expectations. Nature Neuroscience, 11(9),<br />

1004-1006. doi:10.1038/nn.2163.<br />

Suzuki, S., & Grabowecky, M. (2003) Attention during adaptation weakens negative afterimages.<br />

Journal of Experimental Psychology: Human Perception and Performance 29:793–807.<br />

VanRullen, R., & Koch, C. (2003). Is perception discrete or continuous? Trends in Cognitive<br />

Sciences, 7(5), 207-213.<br />

Watson, A. B., & Pelli, D. G. (1983). QUEST: a Bayesian adaptive psychometric method.<br />

Perception & Psychophysics, 33(2), 113-120.<br />

Webster, M. A. (2011). Adaptation and visual coding. Journal of Vision, 11(5):3, 1–23,<br />

http://www.journalofvision.org/content/11/5/3, doi:10.1167/11.5.3.<br />

Wentura, D., & Frings, C. (2005). Repeated masked category primes interfere with related<br />

exemplars: new evidence for negative semantic priming. Journal of Experimental<br />

Psychology: Learning, Memory, and Cognition, 31,108-120.<br />

Wiggs, C. L., & Martin, A. (1998). Properties and mechanisms of perceptual priming. Current<br />

Opinion in Neurobiology, 8(2), 227-233.<br />

Zago, L., Fenske, M. J., Aminoff, E., & Bar, M. (2005). The rise and fall of priming: how visual<br />

exposure shapes cortical representations of objects. Cerebral Cortex, 15(11), 1655-1665.<br />

doi:10.1093/cercor/bhi060.


Troisième partie<br />

Discussion


1 Étudier l’encombrement via<br />

l’inconscient cognitif<br />

Classiquement, les travaux visant à mieux comprendre l’origine de l’encombrement ont<br />

manipulé les relations entre voisins et stimulus encombré pour inférer le niveau auquel<br />

avait lieu leur interaction. Dans ce cadre, l’assomption est faite que si des stimuli définis<br />

par des propriétés différentes s’encombrent l’un l’autre, c’est que l’encombrement trouve<br />

son origine là où les deux informations sont encodées de manière combinée. Par exemple,<br />

comme des stimuli définis par une valeur de luminance sont à même d’en encombrer<br />

d’autres, définis par une variation de contraste, cela suggère que l’encombrement intervient<br />

au niveau où information de premier ordre et de second ordre se rejoignent au sein<br />

des voies visuelles (Chung et al., 2007).<br />

L’approche que nous avons suivie est différente, puisque nous avons utilisé l’encombrement<br />

pour empêcher l’accès conscient à une dimension du stimulus, et en mesurer ainsi<br />

son traitement non conscient. En dehors de sa pertinence pour l’étude de l’inconscient<br />

cognitif, nous allons résumer dans un premier temps les enseignements fournis par cette<br />

approche quant au phénomène de l’encombrement proprement dit. Nous discuterons ensuite<br />

comment l’analyse des résultats fournis par les deux approches amènent à considérer<br />

l’encombrement comme un phénomène multifactoriel intervenant à de multiples étapes de<br />

la chaîne de traitement visuel. Nous émettrons des prédictions découlant de nos résultats,<br />

et suggérerons des protocoles expérimentaux pour les tester.<br />

1.1 Vers un modèle hiérarchique de l’encombrement<br />

En réunissant six études (dont une en annexe page 204), notre travail a permis dans un<br />

premier temps d’esquisser la hiérarchie des traitements visuels ayant lieu malgré l’encombrement.<br />

En quoi ces résultats peuvent falsifier ou corroborer les théories expliquant<br />

178


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

l’origine de ce phénomène visuel ? Depuis l’orientation angulaire jusqu’à la configuration<br />

de visages émotionnels, en passant par la direction de symboles ou l’identité faciale, les<br />

traitements de différents niveaux semblent d’abord falsifier une théorie décrivant l’encombrement<br />

comme un filtre absolu et mono-factoriel coupant court au traitement du<br />

flux visuel dès ses premières étapes au sein du cortex. On peut donc ajouter à l’expression<br />

utilisée par Levi (2008) que l’encombrement est un goulot d’étranglement limitant<br />

la reconnaissance consciente des objets, leur traitement non conscient étant au moins en<br />

partie préservé.<br />

Cela signifie-t-il que l’encombrement intervient spécifiquement en aval des voies de traitement<br />

visuel ? Selon Blake et collaborateurs (2006), l’absence de discriminabilité entraînée<br />

par l’encombrement découle d’une cascade d’événements neuraux inaugurés à un point<br />

précoce au sein des voies visuelles, et culminant par l’abolissement de l’activité neurale<br />

associée à l’accès conscient de l’information traitée. Or, nos résultats montrent le maintien<br />

d’un traitement non conscient en aval de la chaîne de traitement, par exemple au<br />

sein de la FFA pour l’information configurale des visages. Ces résultats restent compatibles<br />

avec une origine précoce de l’encombrement, si tant est qu’elle n’empêche pas en<br />

totalité l’encodage des indices nécessaires en aval au traitement de l’information de plus<br />

haut niveau. Afin d’estimer l’importance de l’encombrement à une étape de traitement<br />

donnée, nous allons maintenant interpréter certains de nos résultats en contrastant les<br />

réponses adaptatives mesurées en présence et en absence de l’encombrement.<br />

Le traitement de l’orientation comme premier niveau hiérarchique<br />

Dès les premières étapes de la chaîne de traitement, nous avons trouvé qu’une ligne<br />

orientée encombrée induisait un effet d’amorçage, mais que l’amplitude de ce dernier<br />

souffrait de l’encombrement. Autrement dit, les effets d’amorçages conscients étaient supérieurs<br />

aux effets d’amorçages non conscients, et ce même à stimulation égale (voir<br />

l’étude page 147). La relation entre l’amplitude de l’adaptation sensorielle et l’encombrement<br />

est débattue. Qui plus est, les résultats de la littérature ne concernent qu’un<br />

versant de l’adaptation sensorielle, puisqu’ils se focalisent sur l’habituation, sans mesurer<br />

les effets d’amorçage.<br />

Dans un premier temps, les mesures de seuils perceptuels réalisées par He et collaborateurs<br />

(1996) ont suggéré que l’amplitude de l’habituation à des stimuli orientés était indépendante<br />

de l’encombrement, et donc de l’accès conscient (voir la figure 2.3 page 49). Par<br />

179


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

la suite, d’autres mesures d’effets consécutifs réalisées à contraste plus faible ont contredit<br />

ces résultats, en montrant que l’amplitude de l’habituation diminuait fortement si l’accès<br />

conscient était empêché, que ce soit par l’encombrement ou la rivalité binoculaire (Blake<br />

et al., 2006). Les auteurs de cette étude ont alors suggéré que l’indépendance de l’habituation<br />

et de l’accès conscient observée en premier lieu était due au contraste élevé des<br />

stimuli utilisés, entraînant une saturation de la réponse adaptative. Plus récemment, des<br />

mesures psychophysiques couplées à l’IRMf ont fait progressé le débat selon deux axes<br />

(Bi et al., 2009). D’une part, il a été avéré que la diminution d’amplitude associée à l’encombrement<br />

avait une origine attentionnelle. En contrôlant la capacité des participants<br />

à amplifier attentionellement les stimuli encombrés, l’indépendance de l’habituation et<br />

de l’accès conscient a pu être répliquée aussi bien à contraste élevé que faible. D’autre<br />

part, les mesures en IRMf ont précisé que l’encombrement diminuait l’effet d’habituation<br />

uniquement à partir de V2/V3, l’amplitude de l’effet étant similaire à une situation non<br />

encombrée au niveau de V1. L’habituation à l’orientation ayant lieu à des niveaux allant<br />

de V1 à V4, nous voyons là que l’encombrement n’impacte pas forcément les régions les<br />

plus en amont de la chaîne d’un traitement donné (Fang et al., 2005; Gardner et al.,<br />

2005).<br />

Le tableau que nous venons de brosser est complexe. Si l’indépendance de l’habituation et<br />

de l’encombrement est avérée, son amplitude est donc indépendante de l’accès conscient.<br />

Cela s’oppose au pattern que nous rapportons, dans lequel l’amplitude de l’amorçage<br />

augmente avec l’accès conscient. Cela s’oppose également au pattern d’habituation que<br />

nous rapportons, pour des raisons que nous évoquerons dans la section 2.3 page 193.<br />

Précisons néanmoins qu’à la différence de notre travail où les comparaisons sont faites à<br />

stimulation constante et où la discriminabilité du stimulus est directement estimée, les<br />

autres études confondent niveau d’encombrement et force du signal (en manipulant à la<br />

fois la présence et le contraste des voisins) et ne mesurent pas directement la discriminabilité.<br />

Il serait alors intéressant d’étendre nos résultats comportementaux à l’imagerie<br />

cérébrale puis de les comparer aux résultats rapportés par Bi et collaborateurs.<br />

Un niveau hiérarchique supérieur : le traitement des visages encombrés<br />

Deux autres résultats concernant la perception des visages appuient l’idée que l’encombrement<br />

diminue l’efficacité du traitement visuel, cette fois-ci à des niveaux hiérarchiques<br />

supérieurs au traitement de l’orientation. Nous devons cependant rester prudents, puisqu’ils<br />

concernent des situations où la force des signaux visuels discriminés et non discriminés<br />

est différente. En effet, à la différence de l’orientation angulaire où il est facile de<br />

180


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

moduler la discriminabilité à stimulation constante, c’est une tâche plus délicate pour les<br />

visages, puisque même présentés seuls en périphérie, les traits qui les constituent s’encombrent<br />

eux-mêmes (self-crowding, voir Martelli et al., 2005 ainsi que l’étude présentée<br />

en chapitre 1 page 57).<br />

Premièrement, au cours de l’expérience en IRMf présentée en annexe page 204, nous<br />

avons localisé la FFA en mesurant son activité pendant la perception consciente de visages,<br />

puis mesuré son activité pendant la perception de visages encombrés. En accord<br />

avec ce qui est habituellement trouvé en masquage (Kouider et al., 2009) ou en rivalité<br />

binoculaire (Moradi et al., 2005), nos analyses préliminaires suggèrent que la FFA répond<br />

plus fortement aux visages lorsque ceux ci sont perçus consciemment. Deuxièmement, en<br />

ce qui concerne le traitement émotionnel des visages, nous avons trouvé que le biais de<br />

préférence par les expressions de colère nécessitait l’accès conscient, puisque l’encombrement<br />

empêchait son occurrence (voir chapitre 3 page 79). Clairement, des conclusions<br />

plus solides nécessiteront un usage plus strict de la méthode contrastive, avec des mesures<br />

psychophysiques et neurales de réponses adaptatives à stimulation constante. Par<br />

ailleurs, des mesures à d’autres niveaux hiérarchiques devront être testées, notamment<br />

l’information sémantique des chiffres ou des mots qui évaluerait une dissociation entre<br />

encombrement et traitement non conscient à un niveau plus en aval de la chaîne de<br />

traitement visuel.<br />

Des goulots d’étranglement multiples<br />

Globalement, les influences non conscientes que nous avons mises en évidence semblent<br />

dépendre au moins quantitativement de l’encombrement. Il est possible que la diminution<br />

d’amplitude des influences non conscientes soit uniquement héritée des niveaux les plus<br />

précoces du traitement visuel, par exemple au niveau du cortex extrastrié. Cela argumenterait<br />

donc pour une origine unique et précoce de l’encombrement. Il est également<br />

possible que la diminution d’amplitude ne soit pas simplement héritée des étapes précoces<br />

du traitement visuel, mais émerge spécifiquement au niveau où à lieu le traitement<br />

à l’origine de l’influence mesurée, par exemple la FFA pour les visages. Le fait que l’encombrement<br />

intervienne de manière spécifique entre plusieurs niveaux de représentations<br />

(entre les traits, les parties, ou les configurations d’objets) jette le doute sur son caractère<br />

unitaire, et argumente plutôt en faveur de multiples goulots d’étranglement à différents<br />

sites de la chaîne de traitement.<br />

181


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

Cette dernière propriété est corroborée par la double dissociation du traitement de visages<br />

encombrés que nous avons mise en évidence. A un premier niveau, lorsque les voisins (des<br />

patterns non informatifs constitués d’objets superposés) interagissent avec les traits d’un<br />

visage émotionnel, son traitement configural non conscient est préservé, puisqu’il donne<br />

lieu à un biais de préférence (voir chapitre 2 page 70). Nous avons donc conclu que<br />

l’encombrement par pattern préservait au moins en partie l’encodage de la configuration<br />

des différents traits émotionnels.<br />

A un deuxième niveau, qu’advient-il lorsque des voisins interagissent spécifiquement avec<br />

la dimension du stimulus à l’origine de l’effet mesuré ? Ici, il s’agit donc d’interagir avec<br />

la configuration des traits émotionnels, et d’estimer par la mesure de biais de préférence<br />

si un traitement configural sous-jacent peut néanmoins subsister. Il est connu que<br />

des voisins sous forme de visages peuvent interagir spécifiquement avec la représentation<br />

configurale du visage encombré (Louie et al., 2007). Ce phénomène est également observé<br />

avec l’utilisation de visages de type Mooney à deux tons (Mooney, 1956), pour lesquels<br />

un traitement par trait n’est que secondaire au traitement configural (voir Farzin et al.,<br />

2009, ainsi que la figure 1.1). Nous avons alors mesuré le biais de préférence induit par un<br />

visage émotionnel dont la configuration est encombrée par des visages neutres. Les résultats<br />

ont montré que ces derniers biaisaient tout autant les jugements de préférence que des<br />

visages encombrés par patterns. Nous avons donc conclu que le fait d’interagir par l’encombrement<br />

sur la configuration des traits émotionnels préservaient néanmoins en partie<br />

le traitement configural des expressions faciales. Il apparaît alors que l’encombrement<br />

configural préserve le traitement configural non conscient, tout comme l’encombrement<br />

par des lignes verticales préserve le traitement non conscient de l’orientation. Il y a donc<br />

une première dissociation générale entre le percept et le traitement non conscient, et<br />

une deuxième dissociation plus spécifique entre l’encombrement d’une dimension donnée<br />

et son traitement non conscient. Comme cela a été fait pour confirmer l’encombrement<br />

configural des visages, il serait intéressant de confirmer l’origine configurale du biais de<br />

préférence non conscient en répliquant notre mesure avec des visages émotionnels de type<br />

Mooney, pour lesquels le traitement par trait est dépendant du traitement configural.<br />

Notre interprétation revient à considérer l’encombrement comme une assemblée de goulots<br />

d’étranglement, ou de filtres semi-perméables situés à plusieurs niveaux de la chaîne<br />

de traitement visuel, chacun d’entre eux empêchant la reconnaissance consciente associée<br />

au niveau traité. Il subsiste un traitement de la dimension encombrée, mais d’efficacité<br />

moindre, ce qui induit donc une influence non consciente d’amplitude réduite. Selon<br />

les deux grandes familles théoriques, ces goulots représentent des fenêtres d’intégration<br />

182


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

Figure 1.1: Encombrement configural de visages de type Mooney. A gauche, des exemples de visages<br />

de type Mooney à deux tons sont créés à partir de photographies en niveau de gris. A droite,<br />

en fixant le point rouge, le visage de type Mooney isolé est identifiable, alors que lorsqu’il est<br />

entouré d’autres visages de type Mooney, son information configurale est encombrée. (Adapté de<br />

Farzin et al., 2009).<br />

d’origine histologique ou attentionnelle. Une étude récente propose qu’elles pourraient<br />

également exister sous la forme d’interaction entre régions cérébrales. En effet, des mesures<br />

en IRMf ont montré que durant la perception de lettres, l’encombrement diminuait<br />

la corrélation entre la VWFA et les aires corticales précoces allant de V1 à V4 (Freeman<br />

et al., 2011). Les auteurs expliquent cette diminution par le caractère instable de<br />

la représentation de l’objet issue de tentatives répétées d’intégration de traits provenant<br />

de la lettre cible et de ses voisins. Les interactions entre aires corticales sont supposées<br />

intervenir à plusieurs niveaux de la chaîne de traitement (par exemple, entre la FFA et<br />

les régions extrastriées pour la perception des visages), et signeraient la stabilité d’intégration<br />

de plusieurs traits en un objet unifié.<br />

Locus du goulot d’étranglement primaire<br />

Si l’encombrement intervient à de multiples sites au sein des voies visuelles, quel est le site<br />

primaire ? Une étude élégante a récemment apporté de nouveaux indices pour répondre à<br />

cette question (Liu et al., 2009). Elle se base sur le fait que deux stimuli jouxtant les méridiens<br />

1 vertical (MV) et horizontal (MH) de manière controlatérale (de chaque côté du<br />

méridien) ou ipsilatérale (d’un même côté du méridien) sont proches dans l’espace physique,<br />

mais potentiellement encodés par des régions corticales distantes (voir figure 1.2).<br />

Selon le MV, des stimuli controlatéraux sont encodés au sein d’aires corticales droites et<br />

1. C’est à dire les limites rétinotopiques séparant le champ visuel selon un axe vertical et horizontal.<br />

183


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

Figure 1.2: Représentation rétinotopique de stimuli controlatéraux ou ipsilatéraux au méridien<br />

vertical et horizontal. La disposition controlatérale de deux stimuli implique des représentations<br />

corticales distantes au sein de V1, V2, et V3 pour le méridien vertical, et V2 et V3<br />

uniquement pour le méridien horizontal. (Adapté de Liu et al., 2009).<br />

gauches éloignées au niveau de V1, V2, et V3. En accord, les résultats comportementaux<br />

montrent qu’à distance égale, un voisin ipsilatéral induit un effet d’encombrement plus<br />

important qu’un voisin controlatéral. L’encombrement pour des stimuli controlatéraux<br />

étant non nul, le phénomène doit également intervenir en aval, au sein d’aires visuelles<br />

encodant les stimuli de manière rapprochée. En ce qui concerne le MH, les représentations<br />

corticales de stimuli controlatéraux sont distantes au sein de V2 et V3, mais rapprochées<br />

au sein de V1. Comme aucune asymétrie d’encombrement relative au MH n’a été trouvée,<br />

les auteurs ont conclu que l’encombrement devait trouver son origine au sein d’une<br />

aire corticale encodant de manière discontinue l’hémichamp visuel droit et gauche, et de<br />

manière continue l’hémichamp visuel inférieur et supérieur. Les candidats potentiels sont<br />

d’une part V1, et d’autre part les aires en aval de V3. V1 étant disqualifié 2 , V4 émerge<br />

alors comme le premier candidat potentiel pour l’origine de l’encombrement.<br />

Dans le cadre d’une théorie ascendante, des arguments supplémentaires suggèrent V4<br />

comme origine de l’encombrement. Tout d’abord, l’accroissement de ses champs récepteurs<br />

avec l’excentricité dans le champ de vision est compatible avec le critère de Bouma<br />

(Smith et al., 2001). De plus leur forme en ellipse coïncide avec les fenêtres d’espacement<br />

critique caractérisant l’encombrement, on le rappelle anisotrope selon la direction radiale<br />

et tangentielle (voir Piñon et al., 1998, ainsi que la figure 2.1 page 42). Une étude a<br />

également montré que des stimuli définis par une valeur de luminance étaient à même<br />

2. A la fois de par l’existence d’un encombrement induit par des stimuli controlatéraux au MV, et de<br />

par l’indépendance des effets de suppression à la répétition dans V1 précédemment évoquée (Bi et al.,<br />

2009).<br />

184


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

d’en encombrer d’autres, définis par une variation de contraste (et vice versa), suggérant<br />

que l’encombrement intervient au niveau de V4, où information de premier ordre<br />

et de second ordre sont traitées de manière combinée (Chung et al., 2007). Enfin, il a<br />

été montré qu’un modèle physiologiquement plausible reflétait fidèlement les spécificités<br />

de l’encombrement (espacement critique, agglomération en texture, anisotropie) si ses<br />

paramètres mimaient ceux des populations neuronales présentes au sein de V4 (van den<br />

Berg et al., 2010).<br />

1.2 Rôle de l’attention<br />

Deux études de ce travail sont pertinentes pour discuter du rôle de l’attention dans l’encombrement.<br />

D’une part, nous avons trouvé au cours de notre première étude (chapitre 1<br />

page 57) que l’exercice d’une charge attentionnelle fovéale diminuait l’influence d’un<br />

symbole encombré lors d’une tâche d’amorçage d’action. D’autre part, l’étude en IRMf<br />

présentée en annexe page 204 montre qu’en fonction de la dimension attendue d’un stimulus<br />

chimérique encombré 3 , les régions cérébrales encodant cette dimension présentent<br />

des réponses à la répétition qualitativement différentes.<br />

Les deux manipulations attentionnelles exercées sont différentes : la première vise à<br />

consommer les ressources afin de limiter celles qui sont attribuées au traitement du stimulus<br />

encombré, la deuxième repose sur l’instruction donnée au sujet d’amplifier volontairement<br />

un aspect du stimulus encombré en inhibant l’autre. Cette deuxième manipulation<br />

montre donc les effets associés au fait de se concentrer intentionnellement sur un objet<br />

que l’on ne peut discriminer. Si les deux manipulations attentionnelles exercées sont<br />

différentes, elles aboutissent à un enseignement commun : l’existence de l’amplification<br />

attentionnelle endogène en dehors de l’accès conscient. Une étude précédente avait déjà<br />

établi cette dissociation entre attention endogène et conscience durant la perception de<br />

lignes encombrées (Montaser-Kouhsari & Rajimehr, 2005). Ici, nos résultats montrent<br />

que la dissociation existe également pour des objets plus complexes constitués de traits<br />

multiples. Notre dernière étude en IRMf a pour but la description des bases neurales de<br />

cette dissociation.<br />

Le rôle de l’attention à différents niveaux de traitement, reflété par des modulations d’activité<br />

au sein d’aires cérébrales extrastriées différentes argumente en faveur des influences<br />

3. C’est à dire composé de la superposition de deux dimensions distinctes, dans notre cas l’image<br />

d’un visage ou d’une maison, superposée à des lignes orientées vers la droite ou vers la gauche.<br />

185


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

descendantes sur le phénomène d’encombrement. Néanmoins, dans les deux études, l’amplification<br />

attentionnelle n’était pas associée à une meilleure discrimination du stimulus.<br />

Si l’attention endogène augmente l’influence non consciente de stimuli encombrés sans<br />

augmenter leur discriminabilité, c’est qu’elle amplifie le traitement de l’information sans<br />

changer la taille des fenêtres dans lesquelles elle est intégrée avec ses voisins, ou alors que<br />

la réduction de ces fenêtres n’est pas suffisamment importante. Autrement dit, avec la<br />

configuration de stimuli utilisée, la supposée limite de résolution attentionnelle à l’origine<br />

de l’encombrement serait atteinte, et l’exercice attentionnel endogène ne permettrait pas<br />

de la dépasser. Cela est compatible avec l’idée que l’encombrement est gouverné par des<br />

tailles de fenêtres attentionnelles spécifiques à chaque niveau d’excentricité et chaque aire<br />

de traitement (Tripathy & Cavanagh, 2002).<br />

Les théories descendantes ne préfigurent pas du niveau anatomique de l’occurrence de<br />

l’encombrement, puisque des modulations attentionnelles sont observées dès le LGN<br />

(O’Connor et al., 2002), et V1 (Somers et al., 1999). En lien, des résultats récents<br />

montrent qu’au sein de V1, si la réponse locale à un stimulus périphérique n’est pas modulée<br />

par la présence de voisins proches, ces derniers rendent la distribution du faisceau<br />

attentionnel autour du stimulus encombré plus diffuse (Fang & He, 2008). De manière<br />

congruente avec le caractère anisotrope de l’encombrement observé comportementalement,<br />

cette perturbation de la diffusion attentionnelle n’existe que lorsque les voisins<br />

sont organisés radialement autour stimulus, et non tangentiellement (voir Toet & Levi,<br />

1992; Intriligator & Cavanagh, 2001, ainsi que la sous-section 2.1 page 39). De plus, le fait<br />

que la perturbation existe alors même qu’aucun stimulus central n’est présenté favorise<br />

l’interprétation de l’encombrement comme un phénomène descendant, gouverné par des<br />

processus cognitifs de haut niveau comme la taille des fenêtres attentionnelles, plutôt<br />

qu’ascendant, gouverné par la nature du stimulus et son encodage précoce.<br />

Un modèle influent (Eriksen & St James, 1986) a proposé que l’attention spatiale pouvait<br />

être vue comme un système permettant de zoomer sur certaines parties du champ visuel,<br />

restreignant ainsi la région d’intérêt mais augmentant la résolution avec laquelle elle<br />

est traitée. Par analogie avec un système optique, on peut donc considérer en première<br />

approximation que l’augmentation de la focale du zoom réduit la taille de la fenêtre<br />

attentionnelle. Plus récemment, le modèle de normalisation de l’attention a proposé un<br />

formalisme pour rendre compte du fait que l’attention pouvait remodeler les distributions<br />

d’activité au sein d’une population de neurone, en déplaçant l’équilibre entre excitation<br />

et inhibition (Reynolds & Heeger, 2009).<br />

Une prédiction de ce modèle est qu’en fonction de la taille de la fenêtre d’intégration<br />

186


CHAPITRE 1.<br />

ÉTUDIER L’ENCOMBREMENT VIA L’INCONSCIENT COGNITIF<br />

(modulable, comme décrit notamment par le modèle de Eriksen & St James) et de la<br />

taille du stimulus attendu, l’amplification attentionnelle doit produire un bénéfice perceptuel<br />

selon deux paramètres différents : un gain de réponse, impliquant l’augmentation<br />

de la réponse maximale induite par le stimulus, ou un gain de contraste, impliquant une<br />

meilleure sensibilité. Plus précisément, le modèle prédit un gain de réponse pour un stimulus<br />

de grande taille amplifié au sein d’une fenêtre attentionnelle de taille réduite, et<br />

un gain de contraste pour un stimulus de petite taille au sein d’une fenêtre attentionnelle<br />

de taille importante (voir figure 1.3). Cette prédiction a récemment été confirmée empiriquement,<br />

à la fois pour l’attention exogène et endogène (Herrmann et al., 2010). Si<br />

nous transposons maintenant ce phénomène à la perception encombrée, qui se caractérise<br />

selon la théorie descendante par des fenêtres attentionnelles de trop grande taille, sans<br />

rôle causal de la taille des champs récepteurs dans les régions visuelles précoces, l’amplification<br />

attentionnelle devrait produire spécifiquement un gain de contraste et non un gain<br />

de réponse. Il faudra alors déterminer dans quelle mesure ce gain de contraste permet<br />

d’augmenter la discriminabilité du stimulus encombré.<br />

Figure 1.3: Amplification attentionnelle en fonction de la taille du stimulus et de la fenêtre<br />

attentionnelle. Chaque courbe décrit la relation entre le contraste d’un stimulus et la réponse<br />

qu’il évoque, en fonction qu’il soit attendu (en rouge), ou inattendu (en bleu). Ici, le stimulus<br />

est schématisé par les lignes parallèles noires en bas à droite de chaque panneau, le cercle noir<br />

qui l’entoure représentant un champ récepteur. La fenêtre attentionnelle est schématisée par le<br />

cercle en pointillé rouge. Lorsque le stimulus est de grande taille et que la fenêtre attentionnelle<br />

est petite (panneau de gauche), l’attention produit un gain de réponse qui se manifeste par un<br />

décalage de la courbe vers le haut, l’effet étant maximal à contraste élevé. Lorsque le stimulus<br />

est de taille réduite et que la fenêtre attentionnelle est grande (panneau du milieu), l’attention<br />

produit un gain de contraste qui se manifeste par un décalage de la courbe vers la gauche,<br />

l’effet étant maximal à contraste faible et intermédiaire. En lien avec la théorie attentionnelle<br />

de l’encombrement, l’amplification attentionnelle d’un stimulus encombré (panneau de droite),<br />

si elle a lieu au sein d’une fenêtre de grande taille, devrait produire un gain de contraste et non<br />

de réponse. (Adapté de Herrmann et al., 2010).<br />

187


2 Étudier la conscience via<br />

l’encombrement<br />

L’encombrement contingent à la position du regard (GCC) propose une alternative méthodologique<br />

pour l’étude contrastive de la conscience. Dans un premier temps, nous<br />

verrons en quoi l’encombrement reflète une situation de conscience partielle, et comment<br />

il peut aider à en décrire les propriétés. Nous nous intéresserons ensuite à l’étude des<br />

propriétés intégratives de la conscience via le GCC, en évaluant son apport pour l’étude<br />

de l’intégration des informations visuelles dans l’espace, puis dans le temps.<br />

2.1 Encombrement et conscience partielle<br />

L’hypothèse de conscience partielle (Kouider et al., 2010) s’inscrit au sein d’une architecture<br />

hiérarchique du traitement visuel, où le signal est traité par étapes successives,<br />

depuis des informations de bas niveau (luminance, contraste), vers des informations plus<br />

complexes (contextuelles, sémantiques). L’accès conscient est possible indépendamment<br />

à chaque niveau. Ainsi, selon trois déclinaisons, il est possible que tous les éléments d’une<br />

scène visuelle soient accédés, qu’au contraire aucun ne le soit, ou encore que certains le<br />

soient (par exemple le sens global de la scène) et d’autres non (par exemple, la couleur<br />

ou l’orientation d’une ligne spécifique dans la scène). C’est cette troisième modalité qui<br />

réfère à la conscience partielle, elle inclut un vaste panel de situations, résultant de la<br />

combinatoire de multiples niveaux de traitements, chacun étant accédé ou non.<br />

Nous estimons que la perception encombrée est caractéristique d’un accès partiel à l’information,<br />

et ce à de multiples niveaux hiérarchiques. Lors des discussions suivant les<br />

passations expérimentales, les participants rapportaient détecter la présence du stimulus,<br />

sans pouvoir l’identifier. Ils rapportaient même parfois reconnaître une ligne, un symbole,<br />

un visage, mais être incapable d’en reconnaître l’orientation, la direction, l’identité ou<br />

188


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

Figure 2.1: Manipulation des dimensions accédées pendant l’encombrement. En manipulant la similarité<br />

d’une conjonction de deux traits entre un stimulus et ses voisins, il est possible de prévenir<br />

l’accès à un des traits par l’encombrement, en perturbant au minimum l’accès de l’autre. Ainsi, à<br />

gauche, quand les voisins partagent à la fois la couleur et l’orientation du stimulus central, aucune<br />

de ces dimensions n’est accédée. Lorsqu’à droite, les voisins sont présentés horizontalement, la<br />

couleur demeure non accédée, tandis que l’orientation le devient. Ceci est une tentative à but<br />

illustratif, et nécessitera des développements pour être opérationnelle.<br />

l’expression faciale 1 . Nous avons donc mesuré le traitement de la dimension non accédée<br />

du stimulus. Une étude plus fine de la gradation perceptuelle consciente sera possible<br />

par le développement de voisins interagissant spécifiquement avec une dimension, sans<br />

modifier l’accessibilité des autres. Notamment, nous pensons que cela est possible avec<br />

des stimuli simples, composés d’une conjonction de deux traits physiquement distincts,<br />

entourés par des voisins ne partageant que l’un de ses traits, et laissant donc l’autre<br />

accessible à la conscience (voir figure 2.1).<br />

En lien avec l’hypothèse de conscience partielle, il arrive que des participants exposés à<br />

une scène visuelle complexe détectent un changement en son sein, tout en étant incapables<br />

d’en préciser la nature et la location (Rensink, 2004). La cécité au changement n’est donc<br />

pas complète, et une perception résiduelle que certains ont qualifié de vision par l’esprit<br />

(mindsight) semble persister. En considérant que l’encombrement préserve la détection<br />

d’un stimulus, mais empêche sa discrimination par l’agglomération de l’information sous<br />

forme de texture et la perte d’information positionnelle, il semble être un bon candidat<br />

comme mécanisme expliquant cette perception résiduelle. Il serait intéressant d’analyser<br />

à posteriori si l’agencement de stimuli utilisés pour la mettre en évidence respecte le<br />

1. Il serait intéressant d’estimer l’influence du contexte expérimental sur cette impression subjective.<br />

En effet, les participants étant informés de la nature des stimuli encombrés par la tâche de discriminabilité,<br />

il est possible qu’ils aient reconstruit de manière biaisée le stimulus perçu.<br />

189


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

critère de Bouma, ainsi que l’anisotropie, l’inhomogénéité, et l’asymétrie dans le champ<br />

visuel (voir sous-section 2.1 page 39).<br />

L’hypothèse stipule que l’accès à chaque niveau d’information est gouverné par des règles<br />

bayésiennes (Kersten et al., 2004), ce qui donne lieu à un niveau de confiance dépendant<br />

à la fois de la force du signal et du contexte dans lequel il se trouve. Puisque les influences<br />

du contexte et des attentes de l’observateur sont inversement proportionnelles à la force<br />

du signal, cela peut conduire à des illusions perceptuelles en cas de signal faible. En<br />

lien, Greenwood et collaborateurs (2010) ont montré que du bruit visuel entouré par<br />

des voisins orientés était lui même perçu comme orienté, de même que la rotation des<br />

voisins induisait une illusion de rotation du bruit. L’encombrement peut donc changer<br />

de manière illusoire l’apparence d’un signal faible voire absent.<br />

De manière critique, ce n’est pas la gradation dans le processus même d’accès à l’information<br />

qui explique la forme graduée de l’expérience subjective consciente, mais plutôt<br />

l’accès restreint à un sous-ensemble des propriétés d’un stimulus. En ce sens, l’hypothèse<br />

est compatible avec l’accès en tout ou rien prédit par la théorie de l’espace de travail<br />

neuronal global (Dehaene et al., 2003). L’étude présentée en chapitre 5 page 147 a montré<br />

que la qualité du percept pouvait varier alors même que la stimulation et le degré<br />

d’encombrement étaient constants. A l’inverse des résultats obtenus sur le phénomène<br />

du clignement attentionnel (Sergent & Dehaene, 2004), les mesures que nous avons effectuées<br />

suggèrent que la perception encombrée ne suit pas une règle en tout ou rien,<br />

puisque une relation linéaire existe entre visibilité subjective et performance objective.<br />

La réconciliation de ce résultat empirique avec les théories d’un accès en tout ou rien<br />

impose de considérer que plusieurs dimensions du stimulus accédées de manière binaire<br />

profitent à la fois au jugement subjectif de visibilité, et à la performance objective sur<br />

la tâche de discrimination de l’orientation. De manière à mieux comprendre les corrélats<br />

neuraux de l’encombrement, il serait intéressant de mesurer quels sont les facteurs<br />

gouvernant la discriminabilité d’un signal encombré constant. Notamment, il est connu<br />

que la détectabilité d’un stimulus fluctue selon les propriétés des oscillations cérébrales<br />

précédant son apparition (voir par exemple Ergenoglu et al. (2004) pour l’amplitude, ou<br />

Busch et al. (2009) pour la phase des rythmes alpha). Il est donc possible que la discriminabilité<br />

de stimuli encombrés soit gouvernée par de tels facteurs, en lien avec l’état<br />

attentionnel ou de vigilance de l’observateur.<br />

L’hypothèse de conscience partielle pousse à reconsidérer l’interprétation des corrélats<br />

neuraux de la conscience, et leur valeur diagnostique pour déterminer la présence ou<br />

l’absence d’une expérience subjective. En effet, si l’on reprend l’exemple de la figure 2.1,<br />

190


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

quel est le régime neural associé à l’accès à l’information angulaire, lorsque l’accès à<br />

l’information chromatique est empêché ? Selon la théorie de l’espace de travail neuronal<br />

global, la diffusion de l’information par les modules traitant l’orientation devrait être<br />

effective, alors que celle des modules traitant la couleur ne devrait pas l’être. Cela donnerait<br />

lieu à une activité neurale ré-entrante entre les régions fronto-pariétales et les aires<br />

sensorielles traitant l’orientation mais pas la couleur. Or, ces modules étant anatomiquement<br />

et fonctionnellement très proches (l’orientation angulaire, comme le contraste<br />

et la constance des couleurs sont encodés au sein de couches distinctes du cortex visuel<br />

primaire, voir Conway, 2009, pour une revue de la littérature), leur régime neural est difficilement<br />

différentiable. Nous touchons donc aux limites des corrélats neuraux qualitatifs,<br />

et considérons que des normes quantitatives pour caractériser l’expérience consciente en<br />

ses différents degrés doivent s’y ajouter. Dans ce cadre, la théorie de l’information de<br />

l’intégration présentée dans la section 1.3.4 page 30 est particulièrement intéressante. Il<br />

ne s’agit pas de réduire l’accès conscient à une valeur, mais plutôt de faire converger<br />

les mesures comportementales objectives, les rapports subjectifs, et les mesures neurales<br />

quantifiables en un corpus d’information intégré. Alors, un échange mutuel entre les différentes<br />

mesures permettra de raffiner à la fois les résultats empiriques et les modèles<br />

théoriques de la conscience (Seth et al., 2008).<br />

2.2 Encombrement et intégration spatiale<br />

Comme indiqué en introduction, l’encombrement fixe une limite à la perception bien<br />

plus drastique que la limite fixée par l’acuité visuelle. On peut alors s’interroger sur l’utilité<br />

d’encoder visuellement des détails périphériques qui n’apparaissent que sous forme de<br />

texture plus grossière. Face à cette interrogation, il faut garder à l’esprit les rôles distincts<br />

de la vision fovéale et périphérique. Comme nous l’avons vu, le principe d’organisation<br />

dans les aires visuelles supérieures dépend de la catégorie d’objets encodée. Les catégories<br />

nécessitant l’analyse fine de détails sont en effet représentées avec un facteur d’agrandissement<br />

élevé de manière latérale, et celles nécessitant l’intégration de l’information<br />

sur de plus grandes distances sont représentées avec des facteurs d’agrandissements plus<br />

faibles de manière médiale (voir la section 1.2 page 16, ainsi que Hasson et al., 2002;<br />

Malach et al., 2002). Ainsi, un rôle majeur joué par la vision périphérique est de couvrir<br />

un espace important, y détecter des portions informatives, et pouvoir ainsi planifier une<br />

saccade oculaire pour une analyse fovéale plus fine.<br />

L’information périphérique est donc encodée de manière synthétique. Une telle stratégie<br />

191


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

n’a de sens que dans un environnement redondant. Or, les visages dans une foule, les<br />

fruits dans un arbre constituent une structure d’objets similaires et donc redondants,<br />

qui autorisent un format d’encodage compressé reposant sur une description intégrée des<br />

éléments, où seule la synthèse de leurs statistiques (par exemple la moyenne) est disponible.<br />

En plus de sa parcimonie 2 , un tel encodage présente de nombreux avantages<br />

(Alvarez, 2011). D’abord, il s’avère efficace puisqu’en réduisant les mesures, l’erreur résiduelle<br />

associée à chacune, si elle est non corrélée, s’annule. Il fait donc particulièrement<br />

sens en périphérie du champ de vision, où nous l’avons vu, chaque mesure est associée à<br />

un bruit important (perte de l’information de localisation, mauvaise résolution attentionnelle,<br />

etc.). Ainsi, la taille moyenne d’un ensemble de stimuli est décrite plus précisément<br />

que la taille individuelle de ses éléments (Ariely, 2001). La perception synthétique peut<br />

également servir de base pour tirer des inférences sur les paramètres d’une distribution<br />

(sa moyenne, sa variance, sa forme) et donc d’y déceler d’éventuelles aberrations (outliers).<br />

En d’autres termes, n’avoir qu’une représentation de la forêt permet néanmoins<br />

d’éviter un arbre mort, de même que coder l’information d’une foule permet qu’un visage<br />

différent saute aux yeux (Haberman & Whitney, 2010). Enfin, la représentation synthétique<br />

d’une scène visuelle intégrée (gist) permet de mieux diriger le focus attentionnel<br />

au niveau d’un site d’intérêt. Notamment, le déploiement de l’attention pendant la recherche<br />

visuelle repose sur des informations contextuelles globales pour détecter la cible.<br />

Ces représentations d’ensemble se rapprochent donc d’un traitement pré-attentionnel,<br />

évoqué en introduction (Treisman, 1985).<br />

En quoi ces représentations d’ensemble se rapprochent-elles de la perception encombrée ?<br />

Tout d’abord, il convient de rappeler que les statistiques synthétiques sont également disponibles<br />

lorsque les éléments d’un ensemble peuvent être traités individuellement (Ariely,<br />

2001). Autrement dit, avoir l’information relative à la forêt n’empêche pas par principe<br />

d’avoir accès aux arbres. On peut donc concevoir l’encombrement comme l’empêchement<br />

spécifique de l’accès conscient aux individualités (les arbres), alors que l’accès à la texture<br />

d’ensemble (la forêt) est préservée. Il a été montré que dans un dispositif de lignes<br />

orientées encombrées, alors que l’orientation d’une cible ne pouvait pas être rapportée,<br />

l’estimation de l’orientation moyenne de l’ensemble des lignes du dispositif était influencée<br />

par l’orientation de la cible (Parkes et al., 2001). Par la suite, il a été montré que les<br />

statistiques synthétiques d’un dispositif encombré contenaient non seulement sa moyenne<br />

mais également sa variance (Solomon, 2010). Lorsqu’elle est encombrée, l’information individuelle<br />

d’orientation non perçue contribue donc à la perception d’une texture globale<br />

2. La compression est économique dans la mesure ou les représentations d’ensemble et individuelles<br />

ne se recoupent pas.<br />

192


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

du dispositif. Ce phénomène a été observé également à des niveau hiérarchiques plus<br />

élevés, notamment en ce qui concerne les visages émotionnels (Haberman & Whitney,<br />

2007, 2009).<br />

Si l’existence et la pertinence écologique de l’intégration spatiale pour la perception d’ensemble<br />

est peu débattue, son lien direct avec l’encombrement a récemment été remis en<br />

question (Bulakowski et al., 2011). En considérant que l’encombrement et la perception<br />

d’ensemble reposent sur des mécanismes communs, l’intensité de l’encombrement devrait<br />

covarier avec la précision des statistiques synthétiques tirées de l’information prise dans<br />

son ensemble. Or, alors que l’encombrement est plus drastique dans l’hémichamp visuel<br />

supérieur qu’inférieur (He et al., 1996), Bulakowski et collaborateurs ont montré que<br />

l’estimation de l’orientation moyenne d’un ensemble de lignes possède la même précision<br />

dans les deux hémichamps. Il semble donc que l’encombrement puisse dégrader la<br />

perception des individualités sans pour autant améliorer la synthèse de l’information de<br />

l’ensemble. Ses liens précis avec l’intégration spatiale restent donc à préciser. Nous allons<br />

maintenant voir en quoi il peut-être un phénomène intéressant pour étudier l’intégration<br />

dans le temps.<br />

2.3 Inconscient cognitif et temporalité<br />

Lorsque l’on est immergé dans l’environnement, le flux visuel change constamment à mesure<br />

que les objets qui nous entourent bougent, et que l’on bouge par rapport à ces objets.<br />

La structure temporelle du flux est complexe, mais également d’une importance cruciale<br />

puisqu’elle encode les propriétés nécessaires à l’interprétation d’un monde dynamique,<br />

comme par exemple la direction cinétique, la synchronie, la causalité, ou l’intentionnalité.<br />

Des changements physiques intervenant pendant une période de temps doivent donc être<br />

intégrés en une représentation perceptuelle unique, afin de pouvoir tirer des inférences<br />

sur l’événement dynamique pris dans son ensemble. L’intégration temporelle peut-être<br />

vue comme l’action d’un filtre passe-bas sur le signal, qui le lisse sur une dimension dynamique<br />

donnée (VanRullen & Koch, 2003; Holcombe, 2009). Cela explique notamment<br />

la capacité à estimer la taille moyenne de stimuli grandissant et rétrécissant au cours<br />

du temps (Albrecht & Scholl, 2010), ou l’émotion moyenne de visages oscillant entre<br />

plusieurs expressions (Haberman et al., 2009).<br />

En raison des limites méthodologiques évoquées en introduction, le traitement de structures<br />

temporelles en l’absence d’accès conscient demeure peu documenté. Pourtant, comme<br />

193


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

l’intégration temporelle est une fonction fondamentale sous-tendant de nombreuses habiletés<br />

cognitives, il est important dans le cadre d’une approche contrastive de mieux décrire<br />

ses propriétés en l’absence d’accès conscient. Outre les travaux de Barbot & Kouider (sous<br />

presse) et Wentura & Frings (2005) ayant mesuré l’influence du temps de présentation<br />

d’une information pour son traitement non conscient, trois études sont particulièrement<br />

intéressantes. A l’aide de l’encombrement, la première a mesuré l’adaptation sensorielle<br />

induite par un mouvement non discriminable, suggérant que le système a pu intégrer<br />

l’information des positions successives du stimulus pendant la période de définition du<br />

mouvement (Rajimehr et al., 2004). A l’aide de la rivalité binoculaire, la deuxième étude<br />

a montré que deux stimuli rivaux représentant des marcheurs schématiques de différentes<br />

couleurs étaient accédés consciemment de manière alternative, sans qu’il y ait alternance<br />

des patterns locaux définissant chaque marcheur (Watson et al., 2004). De plus, la rivalité<br />

était plus importante quand les marcheurs étaient présentés à l’endroit qu’à l’envers, ce<br />

qui suggère non seulement une intégration spatiale des patterns locaux en un pattern global<br />

en fonction de sa pertinence écologique, mais également une intégration temporelle de<br />

ces patterns pour maintenir la représentation du marcheur au cours du temps. Enfin, la<br />

troisième étude a pu esquisser la limite de la gestion du temps par l’inconscient cognitif,<br />

en montrant l’inaptitude à enchaîner deux opérations mentales, c’est à dire à transmettre<br />

une information de la première opération à la deuxième au cours du temps, lorsqu’elles<br />

sont matérialisées par des instructions subliminales (Sackur & Dehaene, 2009).<br />

En tirant profit de l’indépendance entre discriminabilité et durée de stimulation fournie<br />

par le GCC, nous avons pu estimer l’influence respective de ces deux propriétés sur la<br />

réponse adaptative à l’orientation angulaire. D’autre part, nous avons pu caractériser le<br />

traitement non conscient d’une structure temporelle de haute pertinence écologique : celle<br />

des expressions faciales. Nous discutons ici de l’apport de ces deux études pour sonder<br />

la manière avec laquelle l’inconscient cognitif appréhende le temps.<br />

Durée de l’information traitée<br />

Brièvement, rappelons que nos résultats suggèrent que l’accès conscient a pour conséquence<br />

l’amplification des effets d’amorçage induits par des durées d’exposition courtes,<br />

et l’annulation, ou en tout cas le retardement des effets d’habituation induits par des<br />

durées d’exposition plus longues (voir chapitre 5 page 147). Nous avons argumenté en<br />

faveur de l’utilisation de la perception non consciente pour mesurer des effets d’adaptation<br />

sensorielle, afin d’éviter d’une part la mise en place de stratégies explicites par<br />

194


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

les participants, ainsi que les mécanismes d’amplification et de maintien temporel des<br />

représentations perceptuelles associés à l’accès conscient.<br />

De manière intrigante, nous n’avons pas retrouvé la trace d’un renversement de l’amorçage<br />

en habituation dans notre première étude, puisque les effets d’amorçage induits par<br />

les visages et les symboles directionnels étaient indépendants de leurs durées de présentation<br />

(voir chapitre 1 page 57). Deux différences entre les paradigmes utilisés peuvent<br />

expliquer une telle divergence.<br />

La première raison concerne les niveaux hiérarchiques des traitements mesurés. D’un<br />

côté, l’effet que nous avons obtenu reposait sur l’encodage de l’orientation angulaire, et<br />

de l’autre, sur l’encodage et l’intégration de traits multiples formant un visage ou un<br />

symbole. Nous ne pensons pas que ce facteur soit crucial ici, puisque de tels renversements<br />

d’amorçage en habituation ont été observés à des niveaux hiérarchiques plus<br />

élevés, impliquant par exemple la perception des visages en rivalité binoculaire (Barbot<br />

& Kouider, sous presse), ou le traitement du sens des mots masqués (Wentura & Frings,<br />

2005). Il a été proposé que l’élévation dans la hiérarchie des voies visuelles était associée<br />

à un changement de régime neural, avec notamment un allongement des fenêtres d’intégration<br />

temporelle (Hasson et al., 2008). Il est donc possible que la durée de stimulation<br />

maximale choisie dans notre première étude (1400ms) ait été insuffisante pour induire de<br />

l’habituation.<br />

La deuxième raison est sans doute plus spécifique : le renversement de l’amorçage en habituation<br />

a été observé lorsqu’amorces et cibles apparaissaient à la même position, toutes<br />

deux en périphérie du champ de vision 3 . A l’inverse, dans la première étude, l’amorce<br />

apparaissait en périphérie du champ de vision, alors que la cible apparaissait de manière<br />

fovéale. L’extrapolation de nos résultats appuient donc des résultats récents montrant que<br />

l’habituation à l’orientation intervient localement, à un niveau d’encodage rétinotopique<br />

de l’information (Knapen et al., 2010). Par ailleurs, il est possible que l’importance de<br />

l’évidence sensorielle associée au traitement fovéal de la cible contrecarre les effets d’habituation.<br />

Nous proposons de tester ces hypothèses via un dessin expérimental reposant<br />

sur la manipulation de la position de la cible et de l’amorce, ainsi que sur la manipulation<br />

de leur similarité rétinotopique (voir figure 2.2). A niveau hiérarchique égal, en reposant<br />

sur nos résultats couplés à ceux de Knapen et collaborateurs, nous postulons que l’habituation<br />

découle d’une stimulation répétée à rétinotopie constante, alors que l’amorçage<br />

3. Dans les études montrant des effets d’habituation en encombrement, amorces et cibles apparaissaient<br />

également à la même position (He et al., 1996; Montaser-Kouhsari & Rajimehr, 2005; Blake et al.,<br />

2006; Bi et al., 2009). Nous rappelons cependant qu’une origine rétinienne du renversement est écartée<br />

par la présentation de cibles et d’amorces en opposition de contraste de phase.<br />

195


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

Figure 2.2: Amorçage et habituation en fonction de la rétinotopie. L’adaptation à un stimulus situé<br />

dans l’hémichamp visuel inférieur module la réactivité de neurones précoces dont les champs<br />

récepteurs couvrent la zone stimulée (zone grisée). Nous avons mesuré que les effets d’amorçage<br />

étaient présents, que la cible apparaisse à la même position que l’amorce, ou dans l’hémichamp<br />

visuel opposé (zones vertes). En revanche, nous avons mesuré des effets d’habituation uniquement<br />

lorsque la cible apparaissait à la même position que l’amorce (zone rouge). Nous posons<br />

donc l’hypothèse que l’amorçage résulte d’un phénomène tardif, indépendant de la similarité rétinotopique<br />

entre cible et amorce, alors que l’habituation découle d’un mécanisme plus précoce<br />

dépendant de la rétinotopie.<br />

découle d’un encodage de l’orientation angulaire indépendant de la rétinotopie. Si ces<br />

résultats sont avérés, cela suggérerait que les deux conséquences opposées de l’adaptation<br />

sensorielle à l’orientation reposent sur des bases neurales qualitativement distinctes,<br />

l’habituation modulant la réactivité neurale au sein des voies visuelles plus précocement<br />

que l’amorçage.<br />

Dynamique de l’information traitée<br />

Brièvement, rappelons que les résultats d’imagerie fonctionnelle rapportés dans le chapitre<br />

4 page 113 suggèrent que les expressions faciales statiques sont traitées au sein de<br />

la voie visuelle ventrale avant d’activer l’amygdale, alors que les expressions dynamiques<br />

sont traitées au sein de la voie visuelle dorsale avant d’activer la substantia innominata.<br />

De manière congruente, un modèle a proposé que l’information de forme et l’information<br />

cinétique étaient respectivement traitées dans la voie ventrale et dorsale (Giese & Poggio,<br />

2003). L’opérationnalisation de ce modèle a récemment été rapportée par une étude en<br />

IRMf sur la perception des mouvement corporels (Jastorff & Orban, 2009).<br />

Le modèle stipule que l’information cinétique est déduite de l’apprentissage d’une succession<br />

de clichés décrivant l’information de forme. Des mécanismes d’inhibition latérale<br />

196


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

assurent l’organisation de ces clichés selon un ordre correct, garantissant qu’une succession<br />

aléatoire de clichés n’est pas perçue comme un mouvement biologique. Au sein de<br />

chaque voie, les neurones codant pour une information donnée pré-activent les neurones<br />

encodant la configuration prédite comme devant être subséquente, et inhibent les neurones<br />

encodant les autres configurations. Ainsi, des patterns stables n’existent que lorsque<br />

les neurones sont activés dans un ordre respectant un mouvement biologique existant et<br />

appris. Le modèle est hiérarchique, en ce sens que la progression en aval des deux voies<br />

visuelles est associée à un accroissement des champs récepteurs, et à une extraction d’information<br />

de plus en plus complexe et invariante 4 . A la confluence de ces deux voies,<br />

le sulcus temporal supérieur (STS) apparaît comme un pivot où a lieu l’intégration de<br />

l’information de forme et de mouvement (voir par exemple Grossman et al., 2000, pour<br />

des données en IRMf, et Grossman et al., 2005, pour des évidences de réversibilité via la<br />

TMS). En relation avec l’absence d’intégration entre l’information de forme et de mouvement<br />

que nous avons proposée, nous avons trouvé que le STS n’était pas activé par les<br />

expressions faciales dynamiques encombrées.<br />

Enfin, le modèle prédit que la reconnaissance d’un mouvement biologique repose en<br />

grande partie sur l’activation ascendante des voies visuelles ventrale et dorsale, sans nécessité<br />

d’amplification attentionnelle, de signaux descendants, ou de boucles de ré-entrance.<br />

Cela corrèle notamment avec le fait que le STS est activé de manière très rapide durant la<br />

perception de mouvements biologiques (ce qui rappelle la notion de balayage vers l’avant<br />

évoquée en introduction, voir Oram & Perrett, 1996; Lamme & Roelfsema, 2000), et le<br />

fait que des mouvements biologiques périphériques non attendus influencent malgré tout<br />

le traitement d’un mouvement biologique central (Thornton & Vuong, 2004). Cette propriété<br />

autorise donc à première vue la présence d’une forme d’intégration temporelle non<br />

consciente, sans ré-entrance ni diffusion globale de l’information. Néanmoins, plusieurs<br />

résultats tempèrent cette prédiction. D’abord, la perception de mouvements biologiques<br />

est spécifiquement 5 perturbée chez des patients présentant des lésions pariétales, dont on<br />

sait qu’elles entraînent des déficits attentionnels (Battelli et al., 2003). De plus, chez une<br />

population saine, l’amplification attentionnelle participe à une meilleure discrimination<br />

d’un mouvement biologique entouré de bruit visuel (Cavanagh et al., 2001). L’unique<br />

contribution de mécanismes ascendants ne peut donc expliquer en totalité le traitement<br />

d’une information dynamique. L’encombrement et le GCC en particulier semblent perti-<br />

4. Pour l’information de forme, sont successivement traitées les orientations angulaires, puis les formes<br />

simples, puis les formes corporelles ; pour l’information cinétique, la direction locale, puis globale d’un<br />

mouvement, jusqu’à la spécificité de mouvements relatifs à la marche, la course, ou à une expression<br />

faciale donnée.<br />

5. La perception de mouvements de bas niveau est, elle, préservée.<br />

197


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

nents pour préciser la contribution de l’accès conscient pour la perception de mouvements<br />

biologiques, et notamment si cette dernière requiert des processus descendants, de réentrance,<br />

ou la diffusion de l’information dynamique au sein de régions fronto-pariétales.<br />

Il est connu que la perception consciente de mouvements biologique périphérique est très<br />

rapidement empêchée, ce qui rappelle un mécanisme d’encombrement puisque l’agrandissement<br />

du stimulus ne restaure pas les capacités à percevoir le mouvement (Ikeda et al.,<br />

2005). Il conviendra de préciser par le GCC si néanmoins la perception non consciente<br />

est préservée.<br />

D’un point de vue théorique, la théorie de l’espace de travail neuronal propose que la<br />

diffusion globale de l’information associée à l’accès conscient est nécessaire à l’exécution<br />

de certaines tâches cognitives, notamment celles nécessitant la coopération de multiples<br />

modules, ou le maintien du flux d’information sur des durées prolongées (Dehaene &<br />

Naccache, 2001). Indirectement, elle prédit donc des limites à l’intégration temporelle<br />

non consciente. Couplée à l’approche contrastive, nous pensons que la mesure de ces<br />

limites intégratives permettrait de mieux isoler les corrélats neuraux de la conscience,<br />

d’en affiner ses théories, et finalement conduirait à entamer le dessin des liens entre la<br />

conscience et le temps.<br />

198


Quatrième partie<br />

Conclusion


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

Que restera-t-il de ce travail de thèse une fois l’effervescence passée ? Quelles en sont les<br />

limites ? Quelles perspectives ouvre-t-il pour les sciences de la vision et les sciences de la<br />

conscience ?<br />

Perspectives méthodologiques. Tout d’abord, l’encombrement contingent à la position<br />

du regard (GCC) apporte une méthode alternative à la communauté des neurosciences<br />

cognitives, qu’elle soit spécialisée dans l’étude de la conscience ou de la vision<br />

périphérique. Des extensions au GCC sont dores et déjà envisageables.<br />

Premièrement, des indices encombrés incrustés dans des dispositifs de réalité virtuelle ou<br />

de réalité augmentée pourraient permettre d’estimer le réel impact de la cognition non<br />

consciente lors de l’exploration naturelle de l’environnement, et donc son intérêt écologique<br />

en dehors d’une tâche de psychologie expérimentale plus restreinte. Cette stratégie<br />

en plein essor a déjà porté ses fruits en ce qui concerne les mécanismes d’adaptation sensorielle<br />

de bas niveau (Zhang et al., 2009), et nous développons actuellement un projet<br />

en ce sens basé sur l’étude de la navigation spatiale en présence d’indices directionnels<br />

encombrés.<br />

Un autre champ de recherche très dynamique concerne le développement de la conscience<br />

perceptuelle au cours de la vie. Si les premiers résultats obtenus avec le masquage visuel<br />

sont prometteurs (Gelskov & Kouider, 2009), l’encombrement a également été utilisé à<br />

des fins similaires (Farzin et al., 2010), et il semble que la souplesse d’utilisation du<br />

GCC soit pertinente dans le cadre d’une approche contrastive développementale de la<br />

conscience. Les mesures oculométriques sont déjà couramment utilisées chez le très jeune<br />

enfant (voir Gredebäck et al., 2010, pour une revue de la littérature), mais il sera en<br />

revanche nécessaire d’adapter le GCC en terme de dessin expérimental, et notamment<br />

d’utiliser des mesures de réponses comportementales indirectes.<br />

Même si les mesures comportementales et neurales que nous avons utilisées ont permis<br />

de répondre aux questions que nous soulevions, nous n’avons pas tiré parti des mesures<br />

oculométriques fournies par le GCC. En effet, les analyses d’aires pupillaires et de mouvements<br />

oculaires que nous avons effectuées n’ont pas donné de résultats satisfaisants. Le<br />

dessin expérimental, tel que nous l’avons conçu, impose la fixation oculaire en un point<br />

et n’est sans doute pas tout à fait adapté à cette stratégie. Il conviendra donc par la<br />

suite d’adapter le protocole, notamment pour tirer parti des enseignements fournis par<br />

la dilatation pupillaire lors d’un traitement non conscient (voir par exemple Bijleveld<br />

200


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

et al., 2009), ou par l’orientation des microsaccades lors de l’attention endogène couverte<br />

(Engbert & Kliegl, 2003).<br />

Enfin, si nos travaux, tout comme l’immense majorité des recherches sur la conscience<br />

perceptuelle concernent la vision, on peut s’interroger sur l’existence de l’encombrement<br />

dans d’autres modalités sensorielles. Par exemple, des informations tactiles non discriminables<br />

car trop rapprochées dans des régions somesthésiques de faibles résolutions<br />

sont-elles néanmoins traitées au delà de ce qui est ressenti subjectivement ? La réponse<br />

à cette question permettrait d’estimer le caractère général des goulots d’étranglement<br />

perceptuels, et donc leur pertinence écologique.<br />

Apport aux sciences de la vision. Comme nous l’avons discuté, nos résultats argumentent<br />

en faveur d’une origine tardive et multiple de l’encombrement le long des voies<br />

visuelles. Alors que la limite connue concernant le traitement d’information encombrée<br />

était située à un niveau précoce (celui de l’orientation angulaire), nous l’avons repoussée<br />

jusqu’à des niveaux hiérarchiques plus élevés, allant jusqu’à l’information configurale de<br />

visages. Nous avons donc supposé que c’était l’accès conscient au produit d’intégration<br />

des différents traits d’un stimulus, plutôt que le processus d’intégration lui-même qui<br />

faisait défaut pendant l’encombrement. En montrant un encodage de l’information encombrée<br />

au sein des voies visuelles extrastriées, les études en IRMf que nous avons conçues<br />

ajoutent également une valeur à la littérature sur l’encombrement, basée principalement<br />

sur des mesures comportementales. Par ailleurs, nous avons apporté une contribution<br />

comportementale et neurale au débat concernant le rôle de l’attention dans la perception<br />

encombrée, et avancé que si son influence sur la taille des fenêtres d’intégration demeurait<br />

incertain, elle amplifiait le signal issu du stimulus encombré et augmentait ainsi son<br />

influence.<br />

Cependant, nous devons admettre qu’aucun de nos résultats pris isolément n’est réellement<br />

décisif pour définir une origine précise de l’encombrement. Il faudra sans doute<br />

par la suite coupler notre approche reposant sur les mesures de traitement non conscient<br />

avec l’approche plus classique reposant sur la manipulation des interactions cible-voisins<br />

pour spécifier plus avant les mécanismes causaux de l’encombrement.<br />

201


CHAPITRE 2.<br />

ÉTUDIER LA CONSCIENCE VIA L’ENCOMBREMENT<br />

Apport aux sciences de la conscience. De manière pragmatique, un intérêt direct de<br />

notre travail est qu’il propose une alternative au masquage et à la rivalité binoculaire<br />

pour étudier les propriétés de l’inconscient cognitif. Ces deux dernières techniques, et<br />

en particulier le masquage, ont été décisives pour sonder sa profondeur, c’est à dire la<br />

complexité des opérations qu’il est capable de réaliser. Dans ce cadre, la preuve d’un<br />

biais de préférence issu d’influences configurales non conscientes étend le paysage de ce<br />

qui était connu jusqu’alors. De plus, afin de poursuivre l’exploration de ce paysage, les<br />

comparaisons méthodologiques que nous avons réalisées confirment l’importance du développement<br />

de nouveaux paradigmes, chacun possédant intrinsèquement des avantages<br />

et des inconvénients.<br />

La description de l’inconscient cognitif ne trouve son intérêt majeur qu’au sein d’une<br />

approche contrastive, visant à mieux décrire les corrélats neuraux de la conscience. Nous<br />

avons montré dans notre dernière étude que la discriminabilité d’un stimulus encombré<br />

pouvait varier, et ce à stimulation constante, ou via des modifications minimales (par<br />

exemple, en changeant la similarité cible-voisin). Cette propriété de l’encombrement,<br />

découverte tardivement, devra être mise à profit dans le futur comme une implémentation<br />

efficace de l’approche contrastive. De plus, dans le cadre de l’hypothèse de conscience<br />

partielle, l’encombrement permettra de manipuler l’accès à certaines dimensions sans<br />

perturber l’accès à d’autres. Cela permettra ainsi de caractériser les régimes neuraux<br />

associés à la gradation de l’expérience subjective, et de confronter leurs propriétés aux<br />

prédictions faites par les théories de la conscience.<br />

Enfin, un dernier apport de nos travaux pour les sciences de la conscience concerne<br />

une dimension de l’inconscient cognitif jusqu’alors inexplorée, celle de la temporalité.<br />

Nous avons en effet accumulé des évidences comportementales sur l’impact de la durée<br />

de stimulation non consciente, et des évidences neurales sur l’impact d’une structure<br />

temporelle sur le traitement non conscient d’expressions faciales. Ces résultats ouvrent<br />

la porte à une étude contrastive de l’intégration temporelle. C’est ce à quoi nous nous<br />

attellerons dans nos projets futurs.<br />

202


Cinquième partie<br />

Annexe


1 Bases neurales de l’amplification<br />

attentionnelle non consciente<br />

1.1 Présentation de l’étude<br />

Nous présentons ici les résultats préliminaires d’une étude en IRMf visant à décrire les<br />

bases neurales de l’amplification attentionnelle endogène pendant l’encombrement. Nous<br />

avons développé un paradigme d’amorçage, dans lequel cibles et amorces sont chimériques,<br />

c’est à dire composées de deux dimensions. Chaque stimulus est composé d’une<br />

image (visage ou maison), superposée à une orientation angulaire (lignes orientées vers<br />

la droite ou vers la gauche). Durant l’expérience, l’amplification attentionnelle est manipulée<br />

d’une part via les instructions, en demandant aux participants de se concentrer sur<br />

une des dimensions des stimuli en ignorant l’autre. D’autre part, elle est contrôlée via la<br />

tâche, qui à chaque essai porte uniquement sur la dimension attendue des stimuli. A l’inverse<br />

de l’étude présentée en chapitre 1 page 57, l’amplification attentionnelle n’est donc<br />

pas manipulée par l’imposition d’une charge cognitive, et fait plutôt appel à l’exercice<br />

volontaire des participants.<br />

Dessin expérimental. Au total, 24 participants (11 hommes et 13 femmes âgés de 18 à<br />

35 ans) ont participé à l’étude. L’expérience principale se découpe en six séries d’environ<br />

9 minutes. Au début de chaque série, les participants reçoivent comme instruction de<br />

se concentrer soit sur la dimension picturale de l’information (c’est à dire déterminer si<br />

l’image contient un visage ou une maison, en ignorant les lignes), soit sur la dimension<br />

angulaire (c’est à dire déterminer si les lignes sont orientées vers la droite ou vers la<br />

gauche, en ignorant les images). Les séries sont alternativement picturales ou angulaires,<br />

le type de la série initiale étant contrebalancé selon le facteur participant.<br />

Les participants fixent une croix en haut de l’écran et sont exposés à l’amorce périphérique<br />

(13°) pendant 3000 ± 500ms. L’encombrement est réalisé par des voisins constitués<br />

204


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

des mêmes patterns que dans nos expériences précédentes, cette fois-ci superposés à des<br />

lignes verticales (espacement entre le centre de l’amorce et le centre d’un voisin : 2.3°).<br />

Comme dans les expériences précédentes en GCC, les essais de mesure directe de visibilité<br />

et les essais de mesure indirecte d’adaptation sensorielle sont mélangés de manière aléatoire.<br />

Lors des essais de mesure directe de visibilité, une question concernant la nature<br />

de l’amorce apparaît (respectivement “maison ?” ou “visage ?” dans les séries picturales,<br />

“droite ?” ou “gauche ?” dans les séries angulaires), et les participants doivent y répondre<br />

le plus fidèlement possible dans un délai de 4200ms. Lors des essais de mesure indirecte<br />

de traitement de l’amorce, une cible apparaît à la place de la croix de fixation pendant<br />

150ms, les participants doivent alors indiquer le plus rapidement possible sa nature picturale<br />

(visage ou maison) ou angulaire (droite ou gauche) en fonction de la série dans<br />

laquelle ils se trouvent (voir figure 1.1). Chaque série comprend 16 essais de mesure directe<br />

de visibilité, 64 essais de mesure indirecte d’adaptation sensorielle, et 16 essais de<br />

mesure de ligne de base (seuls les voisins y sont présentés, sans amorce ni cible, ni tâche<br />

cognitive à réaliser), soit 576 essais au total.<br />

Figure 1.1: Paradigme expérimental utilisé en IRMf. Les participants fixant une croix en haut de<br />

l’écran sont exposés à l’amorce périphérique entourée de ses voisins pendant 3000 ± 500ms.<br />

Puis, lors des essais d’amorçage, une cible apparaît pendant 150ms, les participants doivent alors<br />

indiquer le plus rapidement possible sa nature picturale (visage ou maison) ou angulaire (droite<br />

ou gauche) en fonction de la série dans laquelle ils se trouvent. Lors des essais de visibilité,<br />

une question concernant la dimension attendue de l’amorce apparaît, les participants doivent y<br />

répondre le plus fidèlement possible dans un délai de 4200ms.<br />

205


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

Stratégie d’analyse. En nous assurant par la mesure directe de discriminabilité que<br />

chaque dimension est inaccessible à la conscience à la fois pour l’information picturale<br />

(d’ = 0.15, p > 0.1) et l’information angulaire (d’ = 0.10, p > 0.3), nous avons mesuré<br />

par adaptation sensorielle l’effet de l’amplification attentionnelle sur le traitement<br />

d’objets encombrés, et ce à différents niveaux hiérarchiques. La physiologie cérébrale implique<br />

que l’activité d’une région lors de la présentation d’un stimulus est modulée par<br />

la présentation au préalable d’un stimulus identique, ou similaire selon une dimension<br />

donnée (Grill-Spector et al., 2006). La modulation peut-être négative, le signal BOLD<br />

reflétant l’activité cérébrale est alors plus faible pour des stimuli répétés, ce qui donne<br />

lieu au phénomène de suppression à la répétition. Elle peut également être positive,<br />

l’activité cérébrale est alors plus élevée pour des stimuli répétés, ce qui donne lieu au<br />

phénomène d’augmentation à la répétition. Nous nous somme servi de cette réponse<br />

adaptative comme indice indirect du traitement non conscient de l’amorce encombrée.<br />

Dans un premier temps, nous avons estimé l’activité cérébrale via un modèle linéaire<br />

général centré sur la période de présentation de la cible. Nous avons ensuite mesuré<br />

l’amplitude de la réponse adaptative en contrastant l’activité cérébrale lors des essais où<br />

amorces et cibles étaient répétées (par exemple un visage en amorce, suivi d’un même<br />

visage en cible), et lors des essais ou elles étaient non répétées, c’est à dire de catégories<br />

différentes (par exemple un visage en amorce, suivi par une maison en cible, comme<br />

dans la figure 1.1). Nous avons de plus estimé l’effet de l’amplification attentionnelle<br />

en mesurant la réponse adaptative dans la condition où la dimension du stimulus était<br />

attendue (c’est à dire dans les séries picturales pour les images et angulaires pour les<br />

lignes) et en condition où elle était inattendue (c’est à dire dans les séries angulaires<br />

pour les images et picturales pour les lignes).<br />

Le traitement des stimuli utilisés étant précisément localisable au sein des voies visuelles,<br />

nous avons suivi une approche d’analyse en cerveau entier, couplée à une analyse en<br />

régions d’intérêts. Pour cette dernière, au cours d’une deuxième session expérimentale,<br />

nous avons délimité chez chaque participant les aires visuelles striées et extrastriées par<br />

cartographie rétinotopique (voir Wandell & Winawer, 2011, pour une revue récente de la<br />

littérature), et plus en aval l’aire fusiforme des visages (FFA), et l’aire parahippocampique<br />

des lieux (PPA), via une procédure similaire à celle employée dans l’étude du chapitre 4.<br />

Au moment de la rédaction de ce manuscrit, la cartographie rétinotopique est en cours<br />

d’analyse. Nous avons en revanche localisé dès à présent la position anatomique de la<br />

FFA (en moyenne, x, y, z = [-42, -48, -24] et [44, -54, -24], p < 0.001 non corrigé) et de<br />

la PPA (en moyenne x, y, z = [-22, -42, -18] et [22, -34, -22], p < 0.001 non corrigé) (voir<br />

206


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

figure 1.2). Un participant chez qui la FFA et la PPA n’ont pu être localisées a été exclu<br />

de l’analyse.<br />

En vue de nos résultats présentés en chapitre 1 page 57, l’hypothèse est qu’à différents<br />

niveaux hiérarchiques, dans les voies visuelles précoces pour le traitement de l’orientation<br />

et dans la FFA et la PPA pour le traitement des images, l’amplification attentionnelle<br />

devrait moduler la réponse adaptative, et ce malgré l’encombrement.<br />

Figure 1.2: Localisation fonctionnelle de la FFA et de la PPA. En contrastant l’activité cérébrale<br />

induite par la présentation de visages versus de maisons, nous avons défini chez chaque participant<br />

la position anatomique de la FFA et de la PPA (p < 0.001 non corrigé).<br />

1.2 Résultats préliminaires<br />

La cartographie rétinotopique étant en cours d’analyse, nous ne traiterons ici que des<br />

résultats concernant le traitement de la dimension picturale des amorces, sans aborder<br />

la dimension angulaire.<br />

Analyse de l’effet attentionnel en cerveau entier. Nous présentons ici l’activité cérébrale<br />

liée à la perception d’une cible sous forme de visage ou sous forme de maison, en<br />

condition attendue (c’est à dire extraite des séries picturales) et en condition inattendue<br />

(c’est à dire extraite des séries angulaires) (voir la figure 1.3 ainsi que la table 1.1).<br />

Le contraste [Visages - Maisons] dans la condition attendue montre tout d’abord des activités<br />

motrices, liées aux réponses données lors de la présentation de la cible (effet positif<br />

207


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

à gauche, pour un appui bouton de la main droite lors de la présentation d’un visage,<br />

effet négatif à droite, pour un appui bouton de la main gauche lors de la présentation<br />

d’une maison). Nous pouvons également noter un effet positif au sein du cortex fusiforme<br />

droit et gauche, ainsi qu’un effet négatif au niveau du cortex parahippocampique droit<br />

et gauche.<br />

Le même contraste [Visages - Maisons] dans la condition inattendue ne montre pas d’activité<br />

motrice, puisque les réponses sont données en fonction de la nature angulaire de la<br />

cible. Les stimuli étant contrebalancés, il y a donc autant de réponses droites et gauches<br />

pour les visages et pour les maisons. L’effet au sein du cortex parahippocampique droit et<br />

gauche est également retrouvé, mais non pour le cortex fusiforme au seuil de p < 0.001.<br />

Du fait de la variabilité anatomique interindividuelle, il est possible que l’analyse de<br />

second niveau en cerveau entier ne soit pas suffisamment précise pour observer l’activation<br />

de la FFA en condition inattendue. Nous avons donc analysé spécifiquement l’activité<br />

maximale au niveau des coordonnées de la PPA et de la FFA, fournies par la localisation<br />

fonctionnelle chez chaque participant. En prenant en compte la variabilité individuelle,<br />

cette analyse montre un effet au sein de la PPA pour la condition attendue (t(22) =<br />

-4.02, p < 0.001) et non attendue (t(22) = -3.69, p < 0.005), ainsi qu’au sein de la FFA<br />

pour la condition attendue (t(22) = 3.94, p < 0.001) et non attendue (t(22) = 2.96, p <<br />

0.01).<br />

Sans être d’un intérêt crucial pour la question que nous posons, ce premier niveau d’analyse<br />

montre des effets cohérents, et confirme donc la validité du modèle utilisé.<br />

208


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

Figure 1.3: Effet attentionnel en cerveau entier. Contraste de l’activité cérébrale induite par la présentation<br />

de cibles sous forme de visages versus de maisons, en condition attendue (séries picturales)<br />

et non attendue (séries angulaires) (p < 0.001 non corrigé).<br />

Table 1.1: Effet attentionnel en cerveau entier.<br />

Anatomie Cluster Z-score p x y z<br />

Condition attendue<br />

cortex moteur gauche 2125 5.72 0.001 -44 -28 58<br />

cortex moteur droit 3411 -5.65 0.001 44 -16 66<br />

cortex fusiforme gauche 16 3.17 0.002 -42 -48 -28<br />

cortex fusiforme droit 44 3.94 0.001 42 -48 -26<br />

cortex parahippocampique gauche 70 -3.66 0.001 -32 -50 -8<br />

cortex parahippocampique droit 190 -3.76 0.001 22 -38 -16<br />

cortex insulaire droit 231 -4.02 0.001 42 0 10<br />

gyrus occipital moyen gauche 109 -3.80 0.001 -34 -92 16<br />

gyrus occipital moyen droit 233 -4.30 0.001 38 -86 14<br />

Condition inattendue<br />

cortex parahippocampique gauche 55 -3.75 0.001 -28 -52 -10<br />

cortex parahippocampique droit 120 -4.01 0.001 28 -40 -18<br />

gyrus occipital moyen gauche 260 -3.69 0.001 -34 -86 12<br />

gyrus occipital moyen droit 465 -4.15 0.001 34 -86 20<br />

209


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

Analyse de la réponse adaptative en régions d’intérêts. Pour mesurer la réponse<br />

adaptative suivant la présentation de l’amorce encombrée, nous avons contrasté l’activité<br />

cérébrale extraite d’une sphère de 12mm au niveau des régions correspondant à la FFA<br />

et à la PPA chez chaque participant, cette fois-ci dans les essais répétés et dans les<br />

essais non répétés. La comparaison est réalisée avec une ANOVA selon le facteur de<br />

latéralisation (hémisphères droit et gauche), et le facteur attentionnel (c’est à dire pour<br />

les séries picturales, dans lesquelles la dimension picturale était attendue, et les séries<br />

angulaires, dans lesquelles la dimension picturale était inattendue).<br />

Concernant la FFA, nous avons trouvé une interaction entre l’effet d’adaptation et le<br />

facteur attentionnel (F (1,22) = 7.27, p < 0.02), indépendamment de la latéralisation (F<br />

< 1). Cela reflète le fait que la FFA était plus activée dans les essais répétés que non<br />

répétés lorsque les visages étaient attendus (t(22) = 2.34, p < 0.03), et moins activée dans<br />

les essais répétés que non répétés lorsque les visages étaient non attendus (t(22) = -2.09,<br />

p < 0.05). Autrement dit, l’amplification attentionnelle a fait passer d’une suppression<br />

à la répétition à une augmentation à la répétition. En ce qui concerne la PPA, nous<br />

n’avons pas retrouvé l’interaction entre l’effet d’adaptation et le facteur attentionnel (F<br />

< 1). Des comparaisons à posteriori révèlent une augmentation à la répétition pour les<br />

maisons attendues (t(22) = 3.51, p < 0.005), mais pas de suppression à la répétition<br />

pour les maisons non attendues (t(22) = 0.40, p > 0.6). Nous pouvons préciser que ces<br />

réponses adaptatives sont spécifiques, puisqu’elles n’existent pas dans la FFA pour des<br />

maisons attendues (p > 0.1) et non attendues (p > 0.7), ni dans la PPA pour des visages<br />

attendus (p > 0.4) et non attendus (p > 0.3).<br />

1.3 Discussion et perspectives<br />

A ce stade de l’analyse, le résultat principal de cette étude est que des stimuli encombrés<br />

attendus déclenchent une réponse adaptative sous forme d’augmentation à la répétition.<br />

Cette réponse adaptative a lieu spécifiquement dans les régions de la voie visuelle ventrale<br />

concernées par le traitement des stimuli encombrés, c’est à dire la FFA pour les visages<br />

et la PPA pour les maisons. Cela confirme nos résultats comportementaux suggérant que<br />

des objets complexes encombrés comme les visages ou les maisons sont traités au delà<br />

du cortex visuel primaire, et que leur contenu informatif n’est pas perdu précocement. Il<br />

conviendra de vérifier si notre paradigme permet les mêmes conclusions pour l’adaptation<br />

à l’orientation angulaire, au sein des différentes régions que nous aurons délimitées par<br />

la cartographie rétinotopique.<br />

210


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

Deux facteurs confortent la présence d’une augmentation plutôt que d’une suppression à<br />

la répétition. Le premier est l’évidence sensorielle. La plupart du temps, les effets d’augmentation<br />

à la répétition sont observés en présence de faible évidence sensorielle, c’est à<br />

dire avec des amorces ou des cibles dégradées (voir par exemple George et al., 1999, pour<br />

des visages, Turk-Browne et al., 2007, pour des lieux). Dans notre paradigme, les amorces<br />

sont dégradées par l’encombrement, et les cibles sont dégradées par la superposition de<br />

lignes orientées, ce qui rend la présence d’une augmentation à la répétition peu surprenante.<br />

Le deuxième facteur expliquant l’augmentation à la répétition est la familiarité<br />

des stimuli. En ce qui concerne les visages, il a été proposé que lorsque amorces et cibles<br />

étaient visibles, la suppression à la répétition était le mode par défaut, l’augmentation<br />

à la répétition n’apparaissant que lorsque la cible était reconnue lors de la deuxième répétition<br />

(Henson et al., 2000). Ainsi, un visage familier, reconnus à chaque présentation,<br />

induit une suppression à la répétition, alors qu’un visage non familier répété deux fois induit<br />

une augmentation à la répétition. Ce résultat semble cohérent avec notre paradigme,<br />

qui ne comprend que des visages non familiers. Il est vrai cependant que des effets de<br />

suppression à la répétition au niveau de la FFA ont été trouvés pour des visages masqués,<br />

à la fois familiers et non familiers (Kouider et al., 2009). Il nous faudra spécifier quelles<br />

différences expérimentales (durée de l’amorce, présence du masque, SOA) sont à l’origine<br />

de cette divergence.<br />

Le deuxième résultat de cette étude est de montrer l’influence de l’amplification attentionnelle<br />

sur la réponse adaptative de stimuli encombrés. En effet, nous avons trouvé que<br />

lorsque l’attention était portée sur la dimension angulaire des stimuli, seuls les visages<br />

produisaient une réponse adaptative, cette fois-ci sous forme de suppression à la répétition.<br />

Cela semble cohérent avec l’idée que les visages forment une catégorie de stimuli<br />

bien spécifique, et activent la FFA alors même qu’ils sont inattendus. De leur côté, les<br />

stimuli représentant des maisons doivent être amplifiés attentionellement pour gagner les<br />

niveaux de représentation spécifiques à la PPA.<br />

Le passage d’une suppression à une augmentation à la répétition lors de l’amplification<br />

attentionnelle de visages encombrés n’est pas facilement explicable. La suppression à la<br />

répétition implique un mécanisme de réglage neural (neural tuning, ou neural sharpening,<br />

Desimone, 1996), dans lequel seuls les neurones les plus spécifiques à l’encodage d’un<br />

stimulus continuent à répondre lorsque ce dernier est présenté une deuxième fois, ce<br />

qui conduit indirectement à une diminution du signal BOLD. En revanche, les effets<br />

d’augmentation à la répétition, bien que fréquemment observés, sont plus difficilement<br />

interprétables. Il doivent provenir d’un recrutement plus important de neurones, ou d’une<br />

211


CHAPITRE 1.<br />

BASES NEURALES DE L’AMPLIFICATION ATTENTIONNELLE NON CONSCIENTE<br />

réponse plus importante des neurones lors de la présentation de la cible.<br />

Il a été observé que l’amplification attentionnelle augmentait l’effet de suppression à<br />

la répétition (Eger et al., 2004), voir transformait l’augmentation à la répétition en<br />

suppression à la répétition (Vuilleumier et al., 2005), ce qui semble aller à l’encontre<br />

du résultat que nous rapportons. Il est vrai que ces études reposent sur l’utilisation de<br />

stimuli visibles, ce qui, comme on l’a vu dans l’étude comportementale du chapitre 5,<br />

peut entraîner des différences qualitatives sur les mesures d’adaptation sensorielle. Un<br />

facteur intéressant pouvant expliquer ce résultat est la pertinence des stimuli en fonction<br />

du contexte expérimental. En effet, dans les séries angulaires, la dimension picturale de<br />

l’amorce et de la cible n’est pas pertinente puisqu’elle ne fait l’objet d’aucune tâche.<br />

Or, comme c’est le cas au niveau de la FFA dans notre expérience, il a été montré<br />

que l’hippocampe présentait des effets d’augmentation à la répétition lorsque les stimuli<br />

étaient pertinents pour la tâche à réaliser, et des effets de suppression à la répétition<br />

quand ils ne l’étaient pas (Kumaran & Maguire, 2009).<br />

Enfin, comme dans notre paradigme le facteur attentionnel module à la fois le contexte de<br />

traitement de la cible et d’amorce, il conviendra de vérifier si le passage d’une suppression<br />

à une augmentation à la répétition est du à une différence de traitement de la cible ou de<br />

l’amorce. Pour cela, en dehors d’une stratégie d’analyse basée sur la mesure de réponses<br />

adaptatives, il nous faudra estimer l’activité cérébrale avec un modèle linéaire général<br />

centré cette fois-ci sur la durée de présentation de l’amorce. Dans un premier temps,<br />

nous vérifierons que la FFA et la PPA répondent spécifiquement à la présentation d’un<br />

visage et d’une maison, et ce malgré l’encombrement. Si il se confirme, nous validerons<br />

ce résultat en tentant de montrer par des analyses multivariées que le pattern d’activité<br />

dans ces régions encode la nature du stimulus encombré. Nous étudierons alors comment<br />

le facteur attentionnel module le traitement de l’amorce et pourrons ainsi estimer si le<br />

passage d’une suppression à une augmentation à la répétition provient d’une différence de<br />

traitement de la cible ou de l’amorce. Notamment, nous estimerons comment l’attention<br />

endogène modifie le régime neural en terme d’amplitude de réponse, mais également en<br />

terme de connectivité fonctionnelle.<br />

212


Bibliographie<br />

Albrecht, A. R. & Scholl, B. J. (2010). Perceptually<br />

averaging in a continuous visual world : extracting<br />

statistical summary representations over time. Psychological<br />

Science, 21(4), 560–567.<br />

Allard, R. & Cavanagh, P. (2011). Crowding in a detection<br />

task : external noise triggers change in processing<br />

strategy. Vision Research, 51(4), 408–416.<br />

Almeida, J., Mahon, B. Z., Nakayama, K., & Caramazza,<br />

A. (2008). Unconscious processing dissociates<br />

along categorical lines. PNAS, 105(39), 15214–<br />

15218. PMID : 18809923.<br />

Alvarez, G. A. (2011). Representing multiple objects<br />

as an ensemble enhances visual cognition. Trends in<br />

Cognitive Sciences, 15(3), 122–131.<br />

Ariely, D. (2001). Seeing sets : representation by statistical<br />

properties. Psychological Science, 12(2), 157–<br />

162.<br />

Baars, B. J. (2005). Global workspace theory of<br />

consciousness : toward a cognitive neuroscience of<br />

human experience. Progress in Brain Research, 150,<br />

45–53.<br />

Balduzzi, D. & Tononi, G. (2008). Integrated information<br />

in discrete dynamical systems : motivation and<br />

theoretical framework. PLoS Computationnal Biology,<br />

4(6).<br />

Banks, W., Bachrach, K., & Larson, D. (1977). Asymmetry<br />

of lateral interference in visual letter identification.<br />

Perception and Psychophysics, 22, 232–240.<br />

Battelli, L., Cavanagh, P., & Thornton, I. M. (2003).<br />

Perception of biological motion in parietal patients.<br />

Neuropsychologia, 41(13), 1808–1816. PMID :<br />

14527544.<br />

Baylor, D. (1996). How photons start vision. PNAS,<br />

93(2), 560–565.<br />

Bi, T., Cai, P., Zhou, T., & Fang, F. (2009). The effect<br />

of crowding on orientation-selective adaptation<br />

in human early visual cortex. Journal of Vision,<br />

9(11), 13.1–1310.<br />

Bijleveld, E., Custers, R., & Aarts, H. (2009). The unconscious<br />

eye opener : pupil dilation reveals strategic<br />

recruitment of resources upon presentation of subliminal<br />

reward cues. Psychological Science, 20(11),<br />

1313–1315.<br />

Blake, R., Tadin, D., Sobel, K. V., Raissian, T. A., &<br />

Chong, S. C. (2006). Strength of early visual adaptation<br />

depends on visual awareness. PNAS, 103(12),<br />

4783–4788.<br />

Block, N. (1995). On a confusion about a function of<br />

consciousness. Behavioral and Brain Sciences, 18(2),<br />

227–247.<br />

Block, N. (2001). Paradox and cross purposes in recent<br />

work on consciousness. Cognition, 79(1-2), 197–219.<br />

Boly, M., Garrido, M. I., Gosseries, O., Bruno, M.-A.,<br />

Boveroux, P., Schnakers, C., Massimini, M., Litvak,<br />

V., Laureys, S., & Friston, K. (2011). Preserved feedforward<br />

but impaired top-down processes in the vegetative<br />

state. Science, 332(6031), 858–862.<br />

Bouma, H. (1970). Interaction effects in parafoveal letter<br />

recognition. Nature, 226(5241), 177–178. PMID :<br />

5437004.<br />

Boyer, J. L., Harrison, S., & Ro, T. (2005). Unconscious<br />

processing of orientation and color without primary<br />

visual cortex. PNAS, 102(46), 16875–16879.<br />

Breiter, H. C., Etcoff, N. L., Whalen, P. J., Kennedy,<br />

W. A., Rauch, S. L., Buckner, R. L., Strauss, M. M.,<br />

Hyman, S. E., & Rosen, B. R. (1996). Response and<br />

habituation of the human amygdala during visual<br />

processing of facial expression. Neuron, 17(5), 875–<br />

887.<br />

Breitmeyer, B. G. (2007). Visual masking : past accomplishments,<br />

present status, future developments.<br />

Advances in Cognitive Psychology, 3(1-2), 9–20.<br />

Broadbent, D. E. (1958). Perception and communication.<br />

Bruce, V. & Young, A. (1986). Understanding face recognition.<br />

British journal of psychology, 77, 305–327.<br />

Bulakowski, P. F., Post, R. B., & Whitney, D. (2009).<br />

Visuomotor crowding : the resolution of grasping in<br />

cluttered scenes. Frontiers in Behavioral Neuroscience,<br />

3, 49.<br />

Bulakowski, P. F., Post, R. B., & Whitney, D. (2011).<br />

Reexamining the possible benefits of visual crowding<br />

: dissociating crowding from ensemble percepts.<br />

Attention Perception and Psychophysics,<br />

73(4), 1003–1009.<br />

214


Bibliographie<br />

Busch, N. A., Dubois, J., & VanRullen, R. (2009). The<br />

phase of ongoing eeg oscillations predicts visual perception.<br />

Journal of Neuroscience, 29(24), 7869–7876.<br />

Calder, A. J. & Jansen, J. (2005). Configural coding<br />

of facial expressions : The impact of inversion and<br />

photographic negative. Visual Cognition, 12(3), 495–<br />

518.<br />

Campbell, F. W. & Gubisch, R. W. (1966). Optical<br />

quality of the human eye. Journal of Physiology,<br />

186(3), 558–578.<br />

Carlson, T. A., Rauschenberger, R., & Verstraten, F.<br />

A. J. (2007). No representation without awareness<br />

in the lateral occipital cortex. Psychological Science,<br />

18(4), 298–302.<br />

Cavanagh, P., Labianca, A. T., & Thornton, I. M.<br />

(2001). Attention-based visual routines : sprites.<br />

Cognition, 80(1-2), 47–60. PMID : 11245839.<br />

Cave, K. R. & Bichot, N. P. (1999). Visuospatial attention<br />

: beyond a spotlight model. Psychonomic<br />

Bulletin and Review, 6(2), 204–223.<br />

Chakravarthi, R. & Cavanagh, P. (2007). Temporal properties<br />

of the polarity advantage effect in crowding.<br />

Journal of Vision, 7(2), 11.<br />

Chakravarthi, R. & Cavanagh, P. (2009). Recovery of a<br />

crowded object by masking the flankers : determining<br />

the locus of feature integration. Journal of Vision,<br />

9(10), 4.1–9. PMID : 19810785.<br />

Chalmers, D. J. (1995). Facing up to the problem of<br />

consciousness. Journal of Consciousness Studies, 2<br />

(3), 1995, pp. 200–219.<br />

Chung, S. T. L. (2007). Learning to identify crowded<br />

letters : does it improve reading speed ? Vision Research,<br />

47(25), 3150–3159.<br />

Chung, S. T. L., Li, R. W., & Levi, D. M. (2007). Crowding<br />

between first- and second-order letter stimuli in<br />

normal foveal and peripheral vision. Journal of Vision,<br />

7(2), 10.1–1013.<br />

Cleeremans, A. (2006). Conscious and unconscious cognition<br />

: A graded, dynamic, perspective. Progress in<br />

psychological science around the world, 1, 401–418.<br />

Cohen, L., Dehaene, S., Naccache, L., Lehéricy, S.,<br />

Dehaene-Lambertz, G., Hénaff, M. A., & Michel, F.<br />

(2000). The visual word form area : spatial and temporal<br />

characterization of an initial stage of reading<br />

in normal subjects and posterior split-brain patients.<br />

Brain, 123 ( Pt 2), 291–307.<br />

Cohen, M. A., Alvarez, G. A., & Nakayama, K. (2011).<br />

Natural-scene perception requires attention. Psychological<br />

Science.<br />

Cohen, M. A. & Dennett, D. C. (2011). Consciousness<br />

cannot be separated from function. Trends in Cognitive<br />

Sciences, 15(8), 358–364.<br />

Conway, B. R. (2009). Color vision, cones, and colorcoding<br />

in the cortex. Neuroscientist, 15(3), 274–290.<br />

Crick, F. & Koch, C. (1995). Are we aware of neural<br />

activity in primary visual cortex ? Nature, 375(6527),<br />

121–123.<br />

de Gardelle, V., Kouider, S., & Sackur, J. (2010).<br />

An oblique illusion modulated by visibility : nonmonotonic<br />

sensory integration in orientation processing.<br />

Journal of Vision, 10(10), 6.<br />

de Gardelle, V., Sackur, J., & Kouider, S. (2009).<br />

Perceptual illusions in brief visual presentations.<br />

Consciousness and Cognition. PMID : 19369096.<br />

Dehaene, S. & Changeux, J. P. (2011). Experimental<br />

and theoretical approaches to conscious processing.<br />

Neuron, 70(2), 200–227.<br />

Dehaene, S., Changeux, J. P., Naccache, L., Sackur, J.,<br />

& Sergent, C. (2006). Conscious, preconscious, and<br />

subliminal processing : a testable taxonomy. Trends<br />

in Cognitive Sciences, 10(5), 204–211.<br />

Dehaene, S. & Naccache, L. (2001). Towards a cognitive<br />

neuroscience of consciousness : basic evidence and a<br />

workspace framework. Cognition, 79(1-2), 1–37.<br />

Dehaene, S., Naccache, L., Cohen, L., Bihan, D. L.,<br />

Mangin, J. F., Poline, J. B., & Rivière, D. (2001).<br />

Cerebral mechanisms of word masking and unconscious<br />

repetition priming. Nature Neuroscience, 4(7),<br />

752–758.<br />

Dehaene, S., Sergent, C., & Changeux, J. P. (2003). A<br />

neuronal network model linking subjective reports<br />

and objective physiological data during conscious<br />

perception. PNAS, 100(14), 8520–8525.<br />

DelCul, A., Dehaene, S., Reyes, P., Bravo, E., & Slachevsky,<br />

A. (2009). Causal role of prefrontal cortex in<br />

the threshold for access to consciousness. Brain : A<br />

Journal of Neurology, 132(Pt 9), 2531–2540. PMID :<br />

19433438.<br />

Derntl, B., Seidel, E.-M., Kainz, E., & Carbon, C.-C.<br />

(2009). Recognition of emotional expressions is affected<br />

by inversion and presentation time. Perception,<br />

38(12), 1849–1862.<br />

215


Bibliographie<br />

Desimone, R. (1996). Neural mechanisms for visual memory<br />

and their role in attention. PNAS, 93(24),<br />

13494–13499.<br />

Desimone, R. & Duncan, J. (1995). Neural mechanisms<br />

of selective visual attention. Annual Review of Neuroscience,<br />

18, 193–222.<br />

Downing, P. E., Jiang, Y., Shuman, M., & Kanwisher,<br />

N. (2001). A cortical area selective for visual processing<br />

of the human body. Science, 293(5539), 2470–<br />

2473.<br />

Dupoux, E., de Gardelle, V., & Kouider, S. (2008). Subliminal<br />

speech perception and auditory streaming.<br />

Cognition, 109(2), 267–273. PMID : 18849024.<br />

Edelman, G. M. (1993). Neural darwinism : selection<br />

and reentrant signaling in higher brain function.<br />

Neuron, 10(2), 115–125.<br />

Edelman, G. M., Gally, J. A., & Baars, B. J. (2011).<br />

Biology of consciousness. Frontiers in Psychology, 2,<br />

4.<br />

Eger, E., Henson, R. N. A., Driver, J., & Dolan,<br />

R. J. (2004). Bold repetition decreases in objectresponsive<br />

ventral visual areas depend on spatial attention.<br />

Journal of Neurophysiology, 92(2), 1241–<br />

1247.<br />

Engbert, R. & Kliegl, R. (2003). Microsaccades uncover<br />

the orientation of covert attention. Vision Research,<br />

43(9), 1035–1045.<br />

Engel, S. A., Glover, G. H., & Wandell, B. A. (1997).<br />

Retinotopic organization in human visual cortex and<br />

the spatial precision of functional mri. Cerebral Cortex,<br />

7(2), 181–192.<br />

Epstein, R. & Kanwisher, N. (1998). A cortical representation<br />

of the local visual environment. Nature,<br />

392(6676), 598–601.<br />

Ergenoglu, T., Demiralp, T., Bayraktaroglu, Z., Ergen,<br />

M., Beydagi, H., & Uresin, Y. (2004). Alpha rhythm<br />

of the eeg modulates visual detection performance in<br />

humans. Cognitive Brain Research, 20(3), 376–383.<br />

Eriksen, C. W. & James, J. D. S. (1986). Visual attention<br />

within and around the field of focal attention :<br />

a zoom lens model. Perception and Psychophysics,<br />

40(4), 225–240.<br />

Faivre, N. & Kouider, S. (2011). Multi-feature objects<br />

elicit nonconscious priming despite crowding. Journal<br />

of Vision, 11(3).<br />

Fang, F. & He (2005). Cortical responses to invisible<br />

objects in the human dorsal and ventral pathways.<br />

Nature Neuroscience, 8(10), 1380–1385.<br />

Fang, F. & He, S. (2008). Crowding alters the spatial<br />

distribution of attention modulation in human primary<br />

visual cortex. Journal of Vision, 8(9), 6.1–6.9.<br />

Fang, F., Murray, S. O., Kersten, D., & He, S. (2005).<br />

Orientation-tuned fmri adaptation in human visual<br />

cortex. Journal of Neurophysiology, 94(6), 4188–<br />

4195.<br />

Farzin, F., Rivera, S. M., & Whitney, D. (2009). Holistic<br />

crowding of mooney faces. Journal of Vision, 9(6),<br />

18.1–1815.<br />

Farzin, F., Rivera, S. M., & Whitney, D. (2010). Spatial<br />

resolution of conscious visual perception in infants.<br />

Psychological Science, 21(10), 1502–1509.<br />

Felisberti, F. M., Solomon, J. A., & Morgan, M. J.<br />

(2005). The role of target salience in crowding. Perception,<br />

34(7), 823–833.<br />

Ferrarelli, F., Massimini, M., Sarasso, S., Casali, A.,<br />

Riedner, B. A., Angelini, G., Tononi, G., & Pearce,<br />

R. A. (2010). Breakdown in cortical effective connectivity<br />

during midazolam-induced loss of consciousness.<br />

PNAS, 107(6), 2681–2686.<br />

Ferrera, V. P., Nealey, T. A., & Maunsell, J. H. (1992).<br />

Mixed parvocellular and magnocellular geniculate signals<br />

in visual area v4. Nature, 358(6389), 756–761.<br />

Fiorentini, C. & Viviani, P. (2011). Is there a dynamic<br />

advantage for facial expressions ? Journal of Vision,<br />

11(3).<br />

Fodor, G. (1983). The modularity of mind. Cambridge,<br />

MA : MIT Press.<br />

Freeman, J., Donner, T. H., & Heeger, D. J. (2011).<br />

Inter-area correlations in the ventral visual pathway<br />

reflect feature integration. Journal of Vision, 11(4).<br />

Freeman, J. & Simoncelli, E. P. (2011). Metamers of<br />

the ventral stream. Nature Neuroscience.<br />

Friston, K. J., Buechel, C., Fink, G. R., Morris, J., Rolls,<br />

E., & Dolan, R. J. (1997). Psychophysiological and<br />

modulatory interactions in neuroimaging. Neuroimage,<br />

6(3), 218–229.<br />

Friston, K. J., Harrison, L., & Penny, W. (2003). Dynamic<br />

causal modelling. Neuroimage, 19(4), 1273–<br />

1302.<br />

Gaillard, R., Dehaene, S., Adam, C., Clemenceau, S.,<br />

Hasboun, D., Baulac, M., Cohen, L., & Naccache, L.<br />

(2009). Converging intracranial markers of conscious<br />

access. PLoS Biology, 7(3), e1000061.<br />

216


Bibliographie<br />

Ganel, T., Valyear, K. F., Goshen-Gottstein, Y., & Goodale,<br />

M. A. (2005). The involvement of the "fusiform<br />

face area" in processing facial expression. Neuropsychologia,<br />

43(11), 1645–1654.<br />

Gardner, J. L., Sun, P., Waggoner, R. A., Ueno, K.,<br />

Tanaka, K., & Cheng, K. (2005). Contrast adaptation<br />

and representation in human early visual cortex.<br />

Neuron, 47(4), 607–620.<br />

Gauthier, I., Tarr, M. J., Moylan, J., Skudlarski, P.,<br />

Gore, J. C., & Anderson, A. W. (2000). The fusiform<br />

"face area" is part of a network that processes<br />

faces at the individual level. Journal of Cognitive<br />

Neuroscience, 12(3), 495–504.<br />

Gazzaniga, M. S. (2005). Forty-five years of split-brain<br />

research and still going strong. Nature Reviews Neuroscience,<br />

6(8), 653–659.<br />

Gelskov, S. V. & Kouider, S. (2009). Psychophysical<br />

thresholds of face visibility during infancy. Cognition.<br />

PMID : 19846071.<br />

George, N., Dolan, R. J., Fink, G. R., Baylis, G. C.,<br />

Russell, C., & Driver, J. (1999). Contrast polarity<br />

and face recognition in the human fusiform gyrus.<br />

Nature Neuroscience, 2(6), 574–580.<br />

Giese, M. A. & Poggio, T. (2003). Neural mechanisms<br />

for the recognition of biological movements. Nature<br />

Reviews Neuroscience, 4(3), 179–192.<br />

Goren, D. & Wilson, H. R. (2006). Quantifying facial<br />

expression recognition across viewing conditions. Vision<br />

Research, 46(8-9), 1253–1262.<br />

Gotts, S. (2003). Mechanisms Underlying Enhanced<br />

Processing Efficiency In Neural Systems. PhD thesis,<br />

Carnegie Mellon University.<br />

Gray, J. (2004). Consciousness : Creeping up on the<br />

hard problem. Oxford University Press.<br />

Gredebäck, G., Johnson, S., & von Hofsten, C. (2010).<br />

Eye tracking in infancy research. Developmental<br />

Neuropsychology, 35(1), 1–19.<br />

Greenwald, A. G., Klinger, M. R., & Schuh, E. S. (1995).<br />

Activation by marginally perceptible ("subliminal")<br />

stimuli : dissociation of unconscious from conscious<br />

cognition. Journal of Experimental Psychology. General,<br />

124(1), 22–42. PMID : 7897340.<br />

Greenwood, J. A., Bex, P. J., & Dakin, S. C. (2010).<br />

Crowding changes appearance. Current Biology,<br />

20(6), 496–501. PMID : 20206527.<br />

Grill-Spector, K., Henson, R., & Martin, A. (2006). Repetition<br />

and the brain : neural models of stimulusspecific<br />

effects. Trends in Cognitive Sciences, 10(1),<br />

14–23.<br />

Grossman, E., Donnelly, M., Price, R., Pickens, D.,<br />

Morgan, V., Neighbor, G., & Blake, R. (2000). Brain<br />

areas involved in perception of biological motion.<br />

Journal of Cognitive Neuroscience, 12(5), 711–720.<br />

Grossman, E. D., Battelli, L., & Pascual-Leone, A.<br />

(2005). Repetitive tms over posterior sts disrupts<br />

perception of biological motion. Vision Research,<br />

45(22), 2847–2853.<br />

Haberman, J., Harp, T., & Whitney, D. (2009). Averaging<br />

facial expression over time. Journal of Vision,<br />

9(11), 1.1–113.<br />

Haberman, J. & Whitney, D. (2007). Rapid extraction<br />

of mean emotion and gender from sets of faces. Current<br />

Biology, 17(17), R751–R753.<br />

Haberman, J. & Whitney, D. (2009). Seeing the mean :<br />

ensemble coding for sets of faces. Journal of Experimental<br />

Psychology : Human Perception and Performance,<br />

35(3), 718–734.<br />

Haberman, J. & Whitney, D. (2010). The visual system<br />

discounts emotional deviants when extracting<br />

average expression. Attention Perception and Psychophysics,<br />

72(7), 1825–1838.<br />

Hasson, U., Levy, I., Behrmann, M., Hendler, T., & Malach,<br />

R. (2002). Eccentricity bias as an organizing<br />

principle for human high-order object areas. Neuron,<br />

34(3), 479–490.<br />

Hasson, U., Yang, E., Vallines, I., Heeger, D. J., & Rubin,<br />

N. (2008). A hierarchy of temporal receptive<br />

windows in human cortex. Journal of Neuroscience,<br />

28(10), 2539–2550.<br />

Haxby, Hoffman, & Gobbini (2000). The distributed<br />

human neural system for face perception. Trends in<br />

Cognitive Sciences, 4(6), 223–233.<br />

Haxby, J. V., Ungerleider, L. G., Clark, V. P., Schouten,<br />

J. L., Hoffman, E. A., & Martin, A. (1999). The effect<br />

of face inversion on activity in human neural systems<br />

for face and object perception. Neuron, 22(1), 189–<br />

199.<br />

Haynes, J.-D. & Rees, G. (2006). Decoding mental<br />

states from brain activity in humans. Nature Reviews<br />

Neuroscience, 7(7), 523–534.<br />

He, S., Cavanagh, P., & Intriligator, J. (1996). Attentional<br />

resolution and the locus of visual awareness.<br />

Nature, 383(6598), 334–337. PMID : 8848045.<br />

217


Bibliographie<br />

Hendry, S. H. & Reid, R. C. (2000). The koniocellular<br />

pathway in primate vision. Annual Review of Neuroscience,<br />

23, 127–153.<br />

Henson, R., Shallice, T., & Dolan, R. (2000). Neuroimaging<br />

evidence for dissociable forms of repetition<br />

priming. Science, 287(5456), 1269–1272.<br />

Henson, R. N., Mouchlianitis, E., Matthews, W. J., &<br />

Kouider, S. (2008). Electrophysiological correlates of<br />

masked face priming. NeuroImage, 40(2), 884–895.<br />

PMID : 18234522.<br />

Herrmann, K., Montaser-Kouhsari, L., Carrasco, M., &<br />

Heeger, D. J. (2010). When size matters : attention<br />

affects performance by contrast or response gain. Nature<br />

Neuroscience, 13(12), 1554–1559.<br />

Holcombe, A. O. (2009). Seeing slow and seeing<br />

fast : two limits on perception. Trends in Cognitive<br />

Sciences, 13(5), 216–221.<br />

Holender, D. (1986). Semantic activation without<br />

conscious identification in dichotic listening, parafoveal<br />

vision, and visual masking : A survey and appraisal.<br />

Behavioral and Brain Sciences, 9-1, 23.<br />

Holender, D. & Duscherer, K. (2004). Unconscious perception<br />

: the need for a paradigm shift. Perception<br />

and Psychophysics, 66(5), 872–81 ; discussion 888–<br />

95.<br />

Hubel, D. H. & Wiesel, T. N. (1959). Receptive fields<br />

of single neurones in the cat’s striate cortex. Journal<br />

of Physiology, 148, 574–591.<br />

Hubel, D. H. & Wiesel, T. N. (1962). Receptive fields,<br />

binocular interaction and functional architecture in<br />

the cat’s visual cortex. Journal of Physiology, 160,<br />

106–154.<br />

Ikeda, H., Blake, R., & Watanabe, K. (2005). Eccentric<br />

perception of biological motion is unscalably poor.<br />

Vision Research, 45(15), 1935–1943.<br />

Intriligator, J. & Cavanagh, P. (2001). The spatial resolution<br />

of visual attention. Cognitive Psychology,<br />

43(3), 171–216. PMID : 11689021.<br />

Jastorff, J. & Orban, G. A. (2009). Human functional<br />

magnetic resonance imaging reveals separation and<br />

integration of shape and motion cues in biological<br />

motion processing. Journal of Neuroscience, 29(22),<br />

7315–7329.<br />

Kanai, R., Muggleton, N. G., & Walsh, V. (2008). Tms<br />

over the intraparietal sulcus induces perceptual fading.<br />

Journal of Neurophysiology, 100(6), 3343–<br />

3350.<br />

Kanwisher, N., McDermott, J., & Chun, M. M. (1997).<br />

The fusiform face area : a module in human extrastriate<br />

cortex specialized for face perception. Journal<br />

of Neuroscience, 17(11), 4302–4311.<br />

Kanwisher, N. & Yovel, G. (2006). The fusiform face<br />

area : a cortical region specialized for the perception<br />

of faces. Philosophical Transactions of the Royal<br />

Society of London. Series B, 361(1476), 2109–2128.<br />

PMID : 17118927.<br />

Kaskan, P. M., Franco, E. C. S., Yamada, E. S.,<br />

de Lima Silveira, L. C., Darlington, R. B., & Finlay,<br />

B. L. (2005). Peripheral variability and central<br />

constancy in mammalian visual system evolution.<br />

Proceedings. Biological Sciences / The Royal<br />

Society, 272(1558), 91–100. PMID : 15875575.<br />

Kastner, S., Schneider, K. A., & Wunderlich, K. (2006).<br />

Beyond a relay nucleus : neuroimaging views on the<br />

human lgn. In Visual perception, pt 2 : fundamentals<br />

of awareness : multi-sensory integration and highorder<br />

perception.<br />

Kawabata, H. & Zeki, S. (2004). Neural correlates of<br />

beauty. Journal of Neurophysiology, 91(4), 1699–<br />

1705.<br />

Kersten, D., Mamassian, P., & Yuille, A. (2004). Object<br />

perception as bayesian inference. Annual Review of<br />

Psychology, 55, 271–304.<br />

Kim, H., Somerville, L. H., Johnstone, T., Alexander,<br />

A. L., & Whalen, P. J. (2003). Inverse amygdala and<br />

medial prefrontal cortex responses to surprised faces.<br />

Neuroreport, 14(18), 2317–2322.<br />

Knapen, T., Rolfs, M., Wexler, M., & Cavanagh, P.<br />

(2010). The reference frame of the tilt aftereffect.<br />

Journal of Vision, 10(1), 8.1–813.<br />

Koch, C. (2004). The Quest for Consciousness : A Neurobiological<br />

Approach. Englewood, Colorado : Roberts<br />

& Company Publishers, 1 edition (march 2004)<br />

edition.<br />

Koch, C. & Tsuchiya, N. (2007). Attention and<br />

consciousness : Two distinct brain processes. Trends<br />

in Cognitive Sciences, 11(1), 16–22.<br />

Kohn, A. (2007). Visual adaptation : physiology, mechanisms,<br />

and functional benefits. Journal of Neurophysiology,<br />

97(5), 3155–3164.<br />

Koivisto, M., Mäntylä, T., & Silvanto, J. (2010). The<br />

role of early visual cortex (v1/v2) in conscious and<br />

unconscious visual perception. Neuroimage, 51(2),<br />

828–834.<br />

218


Bibliographie<br />

Kooi, F. L., Toet, A., Tripathy, S. P., & Levi, D. M.<br />

(1994). The effect of similarity and duration on spatial<br />

interaction in peripheral vision. Spatial Vision,<br />

8(2), 255–279.<br />

Kornell, N., Son, L. K., & Terrace, H. S. (2007). Transfer<br />

of metacognitive skills and hint seeking in monkeys.<br />

Psychol Sci, 18(1), 64–71.<br />

Korte, W. (1923). Uber die gestaltauffassung im indirekten<br />

sehen. Zeitschrift fur Psychologie, 93, 17–82.<br />

Kouider & Dehaene (2007). Levels of processing during<br />

non-conscious perception : a critical review of<br />

visual masking. Philosophical Transactions of the<br />

Royal Society of London. Series B, 362(1481), 857–<br />

875. PMID : 17403642.<br />

Kouider, S., Berthet, V., & Faivre, N. (2011). Preference<br />

is biased by crowded facial expressions. Psychological<br />

Science, 22(2), 184–189.<br />

Kouider, S., de Gardelle, V., Sackur, J., & Dupoux, E.<br />

(2010). How rich is consciousness ? the partial awareness<br />

hypothesis. Trends in Cognitive Sciences, 14(7),<br />

301–307.<br />

Kouider, S., Eger, E., Dolan, R., & Henson, R. N.<br />

(2009). Activity in face-responsive brain regions is<br />

modulated by invisible, attended faces : evidence<br />

from masked priming. Cerebral Cortex, 19(1), 13–<br />

23. PMID : 18400791.<br />

Kumaran, D. & Maguire, E. A. (2009). Novelty signals :<br />

a window into hippocampal information processing.<br />

Trends in Cognitive Sciences, 13(2), 47–54.<br />

Kunimoto, C., Miller, J., & Pashler, H. (2001). Confidence<br />

and accuracy of near-threshold discrimination<br />

responses. Consciousness and Cognition, 10(3), 294–<br />

340.<br />

Lamme, V. A. & Roelfsema, P. R. (2000). The distinct<br />

modes of vision offered by feedforward and recurrent<br />

processing. Trends in Neurosciences, 23(11), 571–<br />

579.<br />

Lamme, V. A. F. (2006a). Towards a true neural stance<br />

on consciousness. Trends in Cognitive Sciences,<br />

10(11), 494–501.<br />

Lamme, V. A. F. (2006b). Zap ! magnetic tricks on<br />

conscious and unconscious vision. Trends in cognitive<br />

Sciences, 10(5), 193–195.<br />

Lamme, V. A. F. (2010). How neuroscience will change<br />

our view on consciousness. Cognitive Neuroscience,<br />

1(3, SI), 204.<br />

Lamme, V. A. F., Zipser, K., & Spekreijse, H. (2002).<br />

Masking interrupts figure-ground signals in v1. Journal<br />

of Cognitive Neuroscience, 14(7), 1044–1053.<br />

Lau, H. C. & Passingham, R. E. (2007). Unconscious activation<br />

of the cognitive control system in the human<br />

prefrontal cortex. Journal of Neuroscience, 27(21),<br />

5805–5811.<br />

Laureys, S. (2005). The neural correlate of<br />

(un)awareness : lessons from the vegetative state.<br />

Trends in Cognitive Sciences, 9(12), 556–559.<br />

Leon, M. I. & Shadlen, M. N. (1998). Exploring the<br />

neurophysiology of decisions. Neuron, 21(4), 669–<br />

672.<br />

Leube, D. T., Yoon, H. W., Rapp, A., Erb, M., Grodd,<br />

W., Bartels, M., & Kircher, T. T. J. (2003). Brain<br />

regions sensitive to the face inversion effect : a functional<br />

magnetic resonance imaging study in humans.<br />

Neuroscience Letters, 342(3), 143–146.<br />

Levi, D. M. (2008). Crowding–an essential bottleneck<br />

for object recognition : a mini-review. Vision Research,<br />

48(5), 635–654. PMID : 18226828.<br />

Levi, D. M. & Carney, T. (2009). Crowding in peripheral<br />

vision : why bigger is better. Current Biology,<br />

19(23), 1988–1993.<br />

Levi, D. M. & Waugh, S. J. (1994). Spatial scale shifts<br />

in peripheral vernier acuity. Vision Research, 34(17),<br />

2215–2238.<br />

Li, F. F., VanRullen, R., Koch, C., & Perona, P. (2002).<br />

Rapid natural scene categorization in the near absence<br />

of attention. PNAS, 99(14), 9596.<br />

Lin, Z. & He, S. (2009). Seeing the invisible : the scope<br />

and limits of unconscious processing in binocular rivalry.<br />

Progress in Neurobiology, 87(4), 195–211.<br />

Liu, T., Jiang, Y., Sun, X., & He, S. (2009). Reduction<br />

of the crowding effect in spatially adjacent but cortically<br />

remote visual stimuli. Current Biology, 19(2),<br />

127–132.<br />

Livne, T. & Sagi, D. (2007). Configuration influence on<br />

crowding. Journal of Vision, 7(2), 4.1–412.<br />

Livne, T. & Sagi, D. (2010). How do flankers’ relations<br />

affect crowding ? Journal of Vision, 10(3), 1.1–114.<br />

Louie, E. G., Bressler, D. W., & Whitney, D. (2007).<br />

Holistic crowding : Selective interference between<br />

configural representations of faces in crowded scenes.<br />

Journal of Vision, 7(2), 24.<br />

219


Bibliographie<br />

Mack, A. & Rock, I. (1998). Inattentional blindness.<br />

Cambridge, MA : MIT Press.<br />

Macknik, S. L. (2006). Visual masking approaches to<br />

visual awareness. Progress in Brain Research, 155,<br />

177–215.<br />

Macmillan & Creelman (2004). Detection theory : a<br />

user’s guide. Psychology Press.<br />

Malach, R., Levy, I., & Hasson, U. (2002). The topography<br />

of high-order human object areas. Trends in<br />

Cognitive Sciences, 6(4), 176–184.<br />

Martelli, M., Majaj, N. J., & Pelli, D. G. (2005). Are<br />

faces processed like words ? a diagnostic test for recognition<br />

by parts. Journal of Vision, 5(1), 58–70.<br />

Massimini, M., Ferrarelli, F., Huber, R., Esser, S. K.,<br />

Singh, H., & Tononi, G. (2005). Breakdown of cortical<br />

effective connectivity during sleep. Science,<br />

309(5744), 2228–2232.<br />

Mattler, U. (2005). Inhibition and decay of motor and<br />

nonmotor priming. Perception and Psychophysics,<br />

67(2), 285–300.<br />

Maunsell, J. H. & Newsome, W. T. (1987). Visual processing<br />

in monkey extrastriate cortex. Annual Review<br />

of Neuroscience, 10, 363–401.<br />

Maurer, D., Grand, R. L., & Mondloch, C. J. (2002).<br />

The many faces of configural processing. Trends in<br />

Cognitive Sciences, 6(6), 255–260.<br />

Merigan, W. H. & Maunsell, J. H. (1993). How parallel<br />

are the primate visual pathways ? Annual Review of<br />

Neuroscience, 16, 369–402.<br />

Milner, A. D. & Goodale, M. A. (1993). Visual pathways<br />

to perception and action. Progress in Brain<br />

Research, 95, 317–337.<br />

Milner, A. D. & Goodale, M. A. (2006). The Visual<br />

Brain in Action. Oxford University Press, USA ; 2<br />

edition.<br />

Milner, A. D. & Goodale, M. A. (2008). Two visual systems<br />

re-viewed. Neuropsychologia, 46(3), 774–785.<br />

Montaser-Kouhsari, L. & Rajimehr, R. (2005). Subliminal<br />

attentional modulation in crowding condition.<br />

Vision Research, 45(7), 839–844.<br />

Mooney, C. M. (1956). Closure with negative afterimages<br />

under flickering light. Canadian Journal of<br />

Psychology, 10(4), 191–199.<br />

Moradi, F., Koch, C., & Shimojo, S. (2005). Face adaptation<br />

depends on seeing the face. Neuron, 45(1),<br />

169–175.<br />

Morris, J. S., Ohman, A., & Dolan, R. J. (1999). A<br />

subcortical pathway to the right amygdala mediating<br />

"unseen" fear. PNAS, 96(4), 1680–1685.<br />

Motter, B. C. & Simoni, D. A. (2007). The roles of<br />

cortical image separation and size in active visual<br />

search performance. Journal of Vision, 7(2), 6.1–<br />

615.<br />

Naccache, L. (2005). Visual phenomenal consciousness :<br />

a neurological guided tour. Progress in Brain Research,<br />

150, 185–195.<br />

Naccache, L., Blandin, E., & Dehaene, S. (2002). Unconscious<br />

masked priming depends on temporal attention.<br />

Psychological Science : A Journal of the<br />

American Psychological Society / APS, 13(5), 416–<br />

424. PMID : 12219807.<br />

Nagel, T. (1974). What is it like to be a bat ? The<br />

Philosophical Review, 83, 435–50.<br />

Neri, P. & Levi, D. M. (2006). Spatial resolution for feature<br />

binding is impaired in peripheral and amblyopic<br />

vision. Journal of Neurophysiology, 96(1), 142–153.<br />

O’Connor, D. H., Fukui, M. M., Pinsk, M. A., & Kastner,<br />

S. (2002). Attention modulates responses in the<br />

human lateral geniculate nucleus. Nature Neuroscience,<br />

5(11), 1203–1209.<br />

Oram, M. W. & Perrett, D. I. (1996). Integration of<br />

form and motion in the anterior superior temporal<br />

polysensory area (stpa) of the macaque monkey.<br />

Journal of Neurophysiology, 76(1), 109–129.<br />

Parker, A. J. (2007). Binocular depth perception and<br />

the cerebral cortex. Nature Reviews Neuroscience,<br />

8(5), 379–391.<br />

Parkes, L., Lund, J., Angelucci, A., Solomon, J. A., &<br />

Morgan, M. (2001). Compulsory averaging of crowded<br />

orientation signals in human vision. Nature Neuroscience,<br />

4(7), 739–744.<br />

Pelli, D. G. (2008). Crowding : a cortical constraint on<br />

object recognition. Current Opinion In Neurobiology,<br />

18(4), 445–451.<br />

Pelli, D. G., Palomares, M., & Majaj, N. J. (2004).<br />

Crowding is unlike ordinary masking : distinguishing<br />

feature integration from detection. Journal of Vision,<br />

4(12), 1136–1169. PMID : 15669917.<br />

Pelli, D. G. & Tillman, K. A. (2008). The uncrowded<br />

window of object recognition. Nature Neuroscience,<br />

11(10), 1129–1135. PMID : 18828191.<br />

220


Bibliographie<br />

Perruchet, P. & Vinter, A. (2002). The self-organizing<br />

consciousness. Behavioral And Brain Sciences,<br />

25(3), 297–330 ; discussion 330–88.<br />

Persaud, N., McLeod, P., & Cowey, A. (2007). Postdecision<br />

wagering objectively measures awareness.<br />

Nat Neurosci, 10(2), 257–261.<br />

Pessoa, L. (2005). To what extent are emotional visual<br />

stimuli processed without attention and awareness<br />

? Current Opinion in Neurobiology, 15(2), 188–<br />

196. PMID : 15831401.<br />

Pessoa, L. & Adolphs, R. (2010). Emotion processing<br />

and the amygdala : from a ’low road’ to ’many roads’<br />

of evaluating biological significance. Nature Reviews<br />

Neuroscience, 11(11), 773–783.<br />

Petrov, Y. & Meleshkevich, O. (2011). Locus of spatial<br />

attention determines inward-outward anisotropy in<br />

crowding. Journal of Vision, 11(4).<br />

Petrov, Y., Popple, A. V., & McKee, S. P. (2007). Crowding<br />

and surround suppression : not to be confused.<br />

Journal of Vision, 7(2), 12.1–12.9.<br />

Piñon, M. C., Gattass, R., & Sousa, A. P. (1998). Area<br />

v4 in cebus monkey : extent and visuotopic organization.<br />

Cerebral Cortex, 8(8), 685–701.<br />

Posner, M. I. (1980). Orienting of attention. Quarterly<br />

Journal of Experimental Psychology, 32(1), 3–25.<br />

Rajimehr, R., Vaziri-Pashkam, M., Afraz, S.-R., & Esteky,<br />

H. (2004). Adaptation to apparent motion in<br />

crowding condition. Vision Research, 44(9), 925–<br />

931.<br />

Raymond, J. E., Shapiro, K. L., & Arnell, K. M. (1992).<br />

Temporary suppression of visual processing in an<br />

rsvp task : an attentional blink ? . Journal of Experimental<br />

Psychology : Human Perception and Performance,<br />

18(3), 849–860.<br />

Rensink, R. A. (2004). Visual sensing without seeing.<br />

Psychological Science, 15(1), 27–32.<br />

Reynolds, J. H. & Heeger, D. J. (2009). The normalization<br />

model of attention. Neuron, 61(2), 168–185.<br />

Rossion, B. (2008). Picture-plane inversion leads to qualitative<br />

changes of face perception. Acta Psychologica,<br />

128(2), 274–289.<br />

Rossion, B. (2009). Distinguishing the cause and consequence<br />

of face inversion : the perceptual field hypothesis.<br />

Acta Psychologica, 132(3), 300–312.<br />

Rossion, B., Dricot, L., Goebel, R., & Busigny, T.<br />

(2011). Holistic face categorization in higher order<br />

visual areas of the normal and prosopagnosic brain :<br />

toward a non-hierarchical view of face perception.<br />

Front Hum Neurosci, 4, 225.<br />

Rounis, E., Maniscalco, B., Rothwell, J. C., Passingham,<br />

R. E., & Lau, H. (2010). Theta-burst transcranial<br />

magnetic stimulation to the prefrontal cortex<br />

impairs metacognitive visual awareness. Cognitive<br />

Neuroscience, 1(3, Sp. Iss. SI), 165–175.<br />

Ryan, S. J., Ogden, T. E., Schachat, A. P., Murphy,<br />

R. P., Glaser, B. M., & Patz, A. (2005). Retina (3<br />

volume set). Mosby Elsevier Health Science, (12),<br />

2559.<br />

Saarela, T. P., Sayim, B., Westheimer, G., & Herzog,<br />

M. H. (2009). Global stimulus configuration modulates<br />

crowding. Journal of Vision, 9(2), 5.<br />

Sackur, J. (2009). L’introspection en psychologie expérimentale.<br />

Revue d’histoire des sciences, T 62<br />

(2/2009), 5–28.<br />

Sackur, J. & Dehaene, S. (2009). The cognitive architecture<br />

for chaining of two mental operations. Cognition.<br />

Sandberg, K., Timmermans, B., Overgaard, M., & Cleeremans,<br />

A. (2010). Measuring consciousness : is one<br />

measure better than the other ? Consciousness and<br />

Cognition, 19(4), 1069–1078.<br />

Scholte, H. S., Witteveen, S. C., Spekreijse, H., &<br />

Lamme, V. A. F. (2006). The influence of inattention<br />

on the neural correlates of scene segmentation.<br />

Brain Research, 1076(1), 106–115.<br />

Scolari, M., Kohnen, A., Barton, B., & Awh, E. (2007).<br />

Spatial attention, preview, and popout : which factors<br />

influence critical spacing in crowded displays ?<br />

Journal of Vision, 7(2), 7.1–723.<br />

Searle, J. (1997). The Mystery of Consciousness. New<br />

York Review Books.<br />

Sergent, C., Baillet, S., & Dehaene, S. (2005). Timing of<br />

the brain events underlying access to consciousness<br />

during the attentional blink. Nat Neurosci, 8(10),<br />

1391–1400.<br />

Sergent, C. & Dehaene, S. (2004). Is consciousness a<br />

gradual phenomenon ? evidence for an all-or-none bifurcation<br />

during the attentional blink. Psychological<br />

Science, 15(11), 720–728.<br />

Seth, A. K. (2008). Post-decision wagering measures<br />

metacognitive content, not sensory consciousness.<br />

Consciousness and Cognition, 17(3), 981–983.<br />

221


Bibliographie<br />

Seth, A. K., Barrett, A. B., & Barnett, L. (2011). Causal<br />

density and integrated information as measures of<br />

conscious level. Philosophical Transactions of the<br />

Royal Society. Series A.<br />

Seth, A. K., Dienes, Z., Cleeremans, A., Overgaard, M.,<br />

& Pessoa, L. (2008). Measuring consciousness : relating<br />

behavioural and neurophysiological approaches.<br />

Trends in Cognitive Sciences, 12(8), 314–321.<br />

Simons, D. J. & Rensink, R. A. (2005). Change blindness<br />

: past, present, and future. Trends in Cognitive<br />

Sciences, 9(1), 16–20.<br />

Smith, A. T., Singh, K. D., Williams, A. L., & Greenlee,<br />

M. W. (2001). Estimating receptive field size from<br />

fmri data in human striate and extrastriate visual<br />

cortex. Cerebral Cortex, 11(12), 1182–1190.<br />

Smith, F. W. & Schyns, P. G. (2009). Smile through<br />

your fear and sadness : transmitting and identifying<br />

facial expression signals over a range of viewing distances.<br />

Psychological Science, 20(10), 1202–1208.<br />

Solomon, J. A. (2010). Visual discrimination of orientation<br />

statistics in crowded and uncrowded arrays.<br />

Journal of Vision, 10(14), 19.<br />

Somers, D. C., Dale, A. M., Seiffert, A. E., & Tootell, R.<br />

B. H. (1999). Functional MRI reveals spatially specific<br />

attentional modulation in human primary visual<br />

cortex. PNAS, 96(4), 1663–1668.<br />

Sperling, G. (1960). The information available in<br />

brief visual presentations. Psychological monographs,<br />

74(11), 1–29.<br />

Strasburger, H. (2005). Unfocused spatial attention underlies<br />

the crowding effect in indirect form vision.<br />

Journal of Vision, 5(11), 8.<br />

Stuart, J. A. & Burian, H. M. (1962). A study of separation<br />

difficulty. its relationship to visual acuity<br />

in normal and amblyopic eyes. American Journal of<br />

Ophthalmology, 53, 471–477.<br />

Sugase, Y., Yamane, S., Ueno, S., & Kawano, K. (1999).<br />

Global and fine information coded by single neurons<br />

in the temporal visual cortex. Nature, 400(6747),<br />

869–873.<br />

Tamietto, M. & de Gelder, B. (2010). Neural bases<br />

of the non-conscious perception of emotional signals.<br />

Nature Reviews Neuroscience, 11(10), 697–709.<br />

Thornton, I. M. & Vuong, Q. C. (2004). Incidental processing<br />

of biological motion. Current Biology, 14(12),<br />

1084–1089.<br />

Thorpe, S. J., Rolls, E. T., & Maddison, S. (1983). The<br />

orbitofrontal cortex : neuronal activity in the behaving<br />

monkey. Experimental Brain Research, 49(1),<br />

93–115.<br />

Toet, A. & Levi, D. M. (1992). The two-dimensional<br />

shape of spatial interaction zones in the parafovea.<br />

Vision Research, 32(7), 1349–1357.<br />

Tong, F., Meng, M., & Blake, R. (2006). Neural bases of<br />

binocular rivalry. Trends Cogn Sci, 10(11), 502–511.<br />

Tononi, G. (2008). Consciousness as integrated information<br />

: a provisional manifesto. Biological Bulletin,<br />

215(3), 216–242.<br />

Tononi, G. & Edelman, G. M. (1998). Consciousness<br />

and complexity. Science, 282(5395), 1846–1851.<br />

Tononi, G. & Koch, C. (2008). The neural correlates of<br />

consciousness : an update. Annals of the New York<br />

Academy of Sciences, 1124, 239–261.<br />

Tovée, M. J. (1994). Neuronal processing. how fast is<br />

the speed of thought ? Current Biology, 4(12), 1125–<br />

1127.<br />

Trautmann, S., Fehr, T., & Herrmann, M. (2009). Emotions<br />

in motion : Dynamic compared to static facial<br />

expressions of disgust and happiness reveal more<br />

widespread emotion-specific activations. Brain Research,<br />

1284, 100–115.<br />

Treisman, A. (1985). Preattentive processing in vision.<br />

Computer Vision Graphics And Image Processing,<br />

31(2), 156–177.<br />

Treisman, A. M. & Gelade, G. (1980). A featureintegration<br />

theory of attention. Cognitive Psychology,<br />

12(1), 97–136.<br />

Tripathy, S. P. & Cavanagh, P. (2002). The extent of<br />

crowding in peripheral vision does not scale with target<br />

size. Vision Research, 42(20), 2357–2369. PMID :<br />

12350424.<br />

Tsuchiya, N. & Koch, C. (2005). Continuous flash suppression<br />

reduces negative afterimages. Nature neuroscience,<br />

8(8), 1096–1101.<br />

Turk-Browne, N. B., Yi, D.-J., Leber, A. B., & Chun,<br />

M. M. (2007). Visual quality determines the direction<br />

of neural repetition effects. Cerebral Cortex,<br />

17(2), 425–433.<br />

van Boxtel, J. J. A., Tsuchiya, N., & Koch, C. (2010).<br />

Opposing effects of attention and consciousness on<br />

afterimages. PNAS, 107(19), 8883–8888.<br />

222


Bibliographie<br />

van Gaal, S., Lamme, V. A. F., Fahrenfort, J. J., &<br />

Ridderinkhof, K. R. (2011). Dissociable brain mechanisms<br />

underlying the conscious and unconscious<br />

control of behavior. Journal of Cognitive Neuroscience,<br />

23(1), 91–105.<br />

van Gaal, S., Ridderinkhof, K. R., Fahrenfort, J. J.,<br />

Scholte, H. S., & Lamme, V. A. F. (2008). Frontal<br />

cortex mediates unconsciously triggered inhibitory<br />

control. Journal of Neuroscience, 28(32), 8053.<br />

Vandenberg, R., Roerdink, J., & Cornelissen, F. (2007).<br />

On the generality of crowding : Visual crowding in<br />

size, saturation, and hue compared to orientation.<br />

Journal of Vision, 7(2), 14.<br />

Vandenberg, R., Roerdink, J., & Cornelissen, F. (2010).<br />

A neurophysiologically plausible population code<br />

model for feature integration explains visual crowding.<br />

PLoS Computational Biology, 6(1), e1000646.<br />

PMID : 20098499.<br />

VanRullen, R. & Koch, C. (2003). Is perception discrete<br />

or continuous ? Trends in Cognitive Sciences, 7(5),<br />

207–213.<br />

Velik, R. (2010). From single neuron-firing to<br />

consciousness–towards the true solution of the binding<br />

problem. Neuroscience & Biobehavioral Reviews,<br />

34(7), 993–1001.<br />

Vorberg, D., Mattler, U., Heinecke, A., Schmidt, T., &<br />

Schwarzbach, J. (2003). Different time courses for visual<br />

perception and action priming. PNAS, 100(10),<br />

6275–6280.<br />

Vuilleumier, P., Armony, J. L., Driver, J., & Dolan, R. J.<br />

(2001). Effects of attention and emotion on face processing<br />

in the human brain : an event-related fmri<br />

study. Neuron, 30(3), 829–841.<br />

Vuilleumier, P., Schwartz, S., Duhoux, S., Dolan, R. J.,<br />

& Driver, J. (2005). Selective attention modulates<br />

neural substrates of repetition priming and "implicit"<br />

visual memory : suppressions and enhancements<br />

revealed by fmri. Journal of Cognitive Neuroscience,<br />

17(8), 1245–1260.<br />

Weiskrantz, L. (2004). Roots of blindsight. Progress in<br />

Brain Research, 144, 229–241.<br />

Wentura, D. & Frings, C. (2005). Repeated masked<br />

category primes interfere with related exemplars :<br />

new evidence for negative semantic priming. Journal<br />

of Experimental Psychology : Learning Memory and<br />

Cognition, 31(1), 108–120.<br />

Whalen, P. J., Rauch, S. L., Etcoff, N. L., McInerney,<br />

S. C., Lee, M. B., & Jenike, M. A. (1998). Masked<br />

presentations of emotional facial expressions modulate<br />

amygdala activity without explicit knowledge.<br />

The Journal of Neuroscience : The Official Journal<br />

of the Society for Neuroscience, 18(1), 411–418.<br />

PMID : 9412517.<br />

Whitney, D. & Levi, D. M. (2011). Visual crowding :<br />

a fundamental limit on conscious perception and object<br />

recognition. Trends in Cognitive Sciences, 15(4),<br />

160–168.<br />

Williams, M. A., Baker, C. I., de Beeck, H. P. O., Shim,<br />

W. M., Dang, S., Triantafyllou, C., & Kanwisher, N.<br />

(2008). Feedback of visual object information to foveal<br />

retinotopic cortex. Nature Neuroscience, 11(12),<br />

1439–1445. PMID : 18978780.<br />

Yeshurun, Y. & Rashal, E. (2010). Precueing attention<br />

to the target location diminishes crowding and reduces<br />

the critical distance. Journal of Vision, 10(10),<br />

16.<br />

Yovel, G. & Kanwisher, N. (2005). The neural basis of<br />

the behavioral face-inversion effect. Current Biology,<br />

15(24), 2256–2262.<br />

Zago, L., Fenske, M. J., Aminoff, E., & Bar, M. (2005).<br />

The rise and fall of priming : how visual exposure<br />

shapes cortical representations of objects. Cerebral<br />

Cortex, 15(11), 1655–1665.<br />

Zhang, P., Bao, M., Kwon, M., He, S., & Engel, S. A.<br />

(2009). Effects of orientation-specific visual deprivation<br />

induced with altered reality. Current Biology,<br />

19(22), 1956–1960.<br />

Wallis, T. S. A. & Bex, P. J. (2011). Visual crowding is<br />

correlated with awareness. Current Biology, 21(3),<br />

254–258.<br />

Wandell, B. A. & Winawer, J. (2011). Imaging retinotopic<br />

maps in the human brain. Vision Research,<br />

51(7), 718–737.<br />

Watson, T. L., Pearson, J., & Clifford, C. W. G. (2004).<br />

Perceptual grouping of biological motion promotes<br />

binocular rivalry. Current Biology, 14(18), 1670–<br />

1674.<br />

223

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!