01.07.2013 Views

Sabine Caussanel - EPHE

Sabine Caussanel - EPHE

Sabine Caussanel - EPHE

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

MINISTERE DE LA JEUNESSE, DE L’EDUCATION NATIONALE<br />

ET DE LA RECHERCHE<br />

ECOLE PRATIQUE DES HAUTES ETUDES<br />

Sciences de la Vie et de la Terre<br />

MEMOIRE<br />

présenté<br />

par<br />

CAUSSANEL <strong>Sabine</strong><br />

Pour l’obtention du diplôme de l’Ecole Pratique des Hautes Etudes<br />

CONTRIBUTION A L’ETUDE DU ROLE DE CKIP-1 DANS LA DIFFERENCIATION<br />

MUSCULAIRE REGULEE PAR PI3-K – IDENTIFICATION DES ARN MESSAGERS<br />

CORRESPONDANT AUX FORMES DE LA PROTEINE CKIP-1<br />

soutenu le 17 Novembre 2003 devant le jury suivant :<br />

EXBRAYAT Jean-Marie - Président<br />

VAYSSIERE Jean-Luc – Examinateur<br />

GOILLOT Evelyne – Examinateur<br />

DE KERCHOVE Alban - Examinateur<br />

Laboratoire de : Directeur : MIGNOTTE Bernard<br />

Génétique Moléculaire et Physiologique- CNRS UPRES- A8087 – Université Versailles/Saint-<br />

Quentin - mignotte@génétique.uvsq.fr<br />

Laboratoire de : Directeur : BRUN Gilbert<br />

Biologie des Régulations Cellulaires – UMR 5161 CNRS- Ecole Normale Supérieure de Lyon -<br />

egoillot@ens-lyon.fr<br />

CAUSSANEL <strong>Sabine</strong> – 17 Novembre 2003 – Pr.MIGNOTTE Bernard<br />

CONTRIBUTION À L’ÉTUDE DU RÔLE DE CKIP-1 DANS LA DIFFERENCIATION MUSCULAIRE<br />

RÉGULÉE PAR PI3-K - IDENTIFICATION DES ARN MESSAGERS CORRESPONDANT AUX DEUX<br />

FORMES DE LA PROTÉINE CKIP-1<br />

<strong>EPHE</strong> Banque de Monographies SVT 1


Au cours de l’étude du rôle de CKIP-1 dans la différenciation musculaire régulée par PI3-K dans la lignée de myoblastes<br />

C2C12, nous avons mis en évidence une nouvelle forme de la protéine CKIP-1. Cette forme a un poids moléculaire de 28kDa<br />

tandis que la protéine entière CKIP-1 a un poids moléculaire de 55kDa. Nous avons réalisé différents mutants de CKIP-1 et<br />

observé que cette forme courte semble correspondre à une protéine CKIP-1 initiée au niveau du deuxième ATG et par<br />

conséquent dépourvue de son domaine pleckstrine. Ce domaine est essentiel à la stimulation de la myogenèse par CKIP-1.<br />

Nous avons caractérisé les ARNm correspondant à ces deux formes en utilisant deux approches expérimentales différentes : la<br />

technique des ARN circulaires et la protection à la RNAse. Nous avons identifié trois populations de transcrits différents<br />

ayant des sites multiples d’initiation de la transcription. Deux d’entre elles ont des sites d’initiation de la transcription situés<br />

en aval du premier codon ATG initiateur.de la traduction et sont donc susceptibles de donner naissance à la forme courte de<br />

CKIP-1 initiée au deuxième ATG. L’analyse de la représentation de ces différentes populations de transcits suggère une<br />

représentation égale des deux protéines dans les cellules C2C12. Ceci a été confirmé en western blot. Ces résultats nous ont<br />

permis de déterminer deux régions pouvant jouer le rôle de régions promotrices. L’analyse de la séquence de ces régions a<br />

révélé des régions riches en GC pouvant correspondre à des régions promotrices de type GC riche dépourvue de boîtes<br />

d’initiation de la transcription comme la boîte TATA ou la boîte CAAT. De plus, cette région possède de nombreux sites Sp-1<br />

qui sont connus pour guider l’initiation de la transcription de gènes ayant des promoteurs dépourvus de boite TATA. En<br />

accord avec nos résultats, ce type de régions promotrices est fréquemment associé à de multiples sites d’initiation.<br />

Mot-Clefs : muscle, différenciation, CKIP-1, promoteurs, ARN messager, protéines.<br />

SOMMAIRE<br />

SOMMAIRE.... …………………………………………………………………………………...3<br />

LISTE DES ABRÉVIATIONS.... ………………………………………………………………...5<br />

INTRODUCTION... ………………………………………………………………………………7<br />

I- Régulation de la Transcription ……………………………………………………………...8<br />

1- Structure d’un gène……........ …………………………………………………………………..8<br />

2- Eléments régulateurs de la transcription dans le promoteur minimal………....... ……………...9<br />

2-1- Promoteur avec boîte TATA (ou boîte Goldberg-Hogness) …………………...... ….9<br />

2-1-1- Mise en place du complexe de pré-initiation de la transcription..... ……….9<br />

2-1-2- Les différentes boîtes pouvant être associée à la boîte TATA .. …………10<br />

2-1-3- Autres éléments initiateurs de la transcription pouvant être associés<br />

à la boîte TATA.. ………………………………………………………………..11<br />

2-1-4- Conclusion …….... ……………………………………………………….12<br />

2-2- Promoteur dépourvu de boîte TATA.... ……………………………………………12<br />

2-2-1- Boîte GC ……….…………………………………………………………12<br />

2-2-2- Rôle de l’Inr en absence de boîte TATA …….…………………………...13<br />

2-2-3- L’élément DPE (Downstream Promoter Element) …….…………………14<br />

2-2-4- L’élément BRE (IIB Recognition Element) ……….……………………..14<br />

2-2-5- Conclusion …………………………………………………………….….15<br />

3- Eléments régulateurs de la transcription dans le promoteur distal…….... ……………………15<br />

II- Maturation des ARN pré-messagers………………………………………………………16<br />

1- La coiffe……………………………………………………………………………………..............<br />

16<br />

<strong>EPHE</strong> Banque de Monographies SVT 2


2- La queue polyA……………………………………………………………………….... …….17<br />

3- L’excision-épissage des introns……………………………………………….... …………….17<br />

3-1- mécanisme d’excision-épissage constitutif………...... ………………………………….17<br />

3-2- mécanisme d’épissage alternatif………………………………………………..... ……..18<br />

3-3- Importance de l’épissage alternatif dans la myogenèse………………....... ……………..19<br />

3-3-1- Le facteur de trancription MEF2 et l’intégrine b1………....... ……………19<br />

3-3-2- Anomalie de l’épissage et pathologie musculaire……………………....…21<br />

3-3-2-1- Le gène MTMR1 (myotubularin-related 1) ……………….……21<br />

3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)..... .22<br />

4- Promoteurs alternatifs…….... ………………………………………………………………...23<br />

Utilisation du promoteur spécifique du muscle (pM) de l’Aldolase A………....... ……….23<br />

III- Régions Régulatrices de l’ARN messager …….………………………………………...24<br />

1- Interactions entre la coiffe, la séquence codante et la queue polyA…………………..... …….24<br />

2- Régulation par la coiffe et la queue polyA………..... ………………………………………...26<br />

3- Régulations par la région 5’UTR…..... ………………………………………………………..26<br />

3-1- IRES (Internal Ribosomal Entry Site)...... ………………………………………………27<br />

3-2- uORF (upstream Open Reading Frame)...... ……………………………………………28<br />

3-3- Présence de Structures Secondaires…...... ………………………………………………30<br />

4- Régulations par la région 3’UTR…..... ………………………………………………………..30<br />

4-1- CPE (Cytoplasmic Polyadenylation Element).... ……………………………………...31<br />

4-2- ARE (AU Rich Element).... ……………………………………………………………31<br />

4-3- Présence de Structures Secondaires...... …………………………………………………32<br />

5- Conclusion ………………...... ………………………………………………………………..33<br />

LISTE DES ABREVIATIONS<br />

+1 : site d’initiation de la transcription ou site de démarrage de la transcription<br />

3’UTR : 3’ UnTranslated Region<br />

5’UTR : 5’ UnTranslated Region<br />

A : adénine<br />

ADN : Acide DésoxyriboNucléique<br />

ADNc : Acide DésoxyriboNucléique complémentaire<br />

Apaf-1 : Apoptosis protease activating factor-1<br />

ARE : AU Rich Element<br />

ARN : Acide RiboNucléique<br />

ARNr : Acide RiboNucléique ribosomal<br />

ARNm : Acide RiboNucléique messager<br />

ARNt : Acide RiboNucléique de transfert<br />

ATG : codon d’initiation de la traduction<br />

<strong>EPHE</strong> Banque de Monographies SVT 3


AUF1 : AU Factor 1<br />

BRE : IIB Recognition Element<br />

C : Cytosine<br />

CBC : Cap Binding Complex<br />

CBP : Cap Binding Protein<br />

CF : Cleavage Factor<br />

CGRP : Calcitonin Gene Related Peptide<br />

CIC-1 : chloride channel-1<br />

CPE : Cytoplasmic Polyadenylation Element<br />

CPEB : CPE Binding protein<br />

CPSF : Cleavage Polyadenylation Specificity Factor<br />

CstF : Cleavage stimulating Factor<br />

CTF: CCAAT binding Transcription Factor<br />

CUG-BP: CUG-Binding Protein<br />

DM : Dystrophie Myotonique<br />

DPE : Downstream Promoter Element<br />

eIF4-(F, E, A, G) : eukaryotic translation Initiation Factor 4-(F, E, A, G)<br />

G : Guanine<br />

GMP : Guanosine Mono-Phosphate<br />

IGF : Insulin Growth Factor<br />

IGFBP-2 : Insulin-like Growth Factor-Binding Protein-2<br />

IgM : Immunoglobuline M<br />

IR : Insulin Receptor<br />

IRE : Iron Responsive Element<br />

IRES : Internal Ribosomal Entry Site<br />

IRP (1 ou 2) : Iron Responsive Protein (1 ou 2)<br />

MCK : Créatine Kinase Musculaire<br />

MEF2 : Myocyte-specific Enhancer-binding Factor 2<br />

MRF : Myogenic Regulatory Factor<br />

MSE : Muscle-specific Splicing Enhancers<br />

MTMR1 : myotubularin-related 1<br />

NLS : Nuclear Import Signal<br />

PABP (I ou II): PolyA Binding Protein (I ou II)<br />

PAP : PolyA Polymérase<br />

PI3-K : PhosphatidylInositol 3-Kinase<br />

PtdIns: PhosphatidylInositol<br />

R : purine (A, G)<br />

snRNA: small nuclear RNA<br />

T : Thymidine<br />

TAFs : TBP Associated Factors<br />

<strong>EPHE</strong> Banque de Monographies SVT 4


TBP : TATA Binding Protein<br />

TFII (A, B, D, E, F, H, J) : Transcriptional Factor II (A, B, D, E, F, H, J)<br />

TfR : Transferrine<br />

U : Uridine<br />

XIAP : X-linked Inhibitor Apoptosis Protein<br />

XLMTM : Myopathie Myotubulaire liée à l’X<br />

Y : pyrimidine (C, U, T)<br />

INTRODUCTION<br />

L’étude de l’expression des gènes nécessite de connaître toutes les zones de régulations<br />

possibles au niveau des gènes et par conséquent des ARN messagers. Il est surprenant de voir qu’un<br />

organisme contenant un nombre de gène défini comporte autant de régulations au niveau moléculaire<br />

et cellulaire. En effet, si l’on prend le cas de l’Homme qui n’a, d’après le séquençage du génome, que<br />

35 000 gènes, on comprend difficilement comment on peut arriver à une complexité moléculaire aussi<br />

grande. Cependant, il a été montré au cours du temps, qu’un même gène pouvait donner naissance à<br />

différents transcrits qui eux-mêmes pouvaient être à l’origine de la synthèse de plusieurs protéines<br />

différentes en fonction des conditions physiologiques et environnementales. Ceci sous-entend que<br />

cette complexité se situe en aval des gènes c’est-à-dire au niveau des étapes de la transcription et de<br />

la traduction.<br />

Effectivement, lors de la transcription d’un même gène, on peut aboutir à plusieurs messagers ;<br />

néanmoins la complexité s’accroît encore chez les Eucaryotes puisque l’on est confronté à une étape<br />

de maturation des messagers. Ainsi chaque pré-messager peut être initié à partir de plusieurs<br />

promoteurs et/ou subir différents épissages alternatifs. Ces étapes peuvent varier en fonction du type<br />

cellulaire ou tissulaire, des conditions physiologiques ou environnementales, ce qui augmente encore<br />

la complexité moléculaire. Cette diversité se poursuit lors de l’étape de traduction. Chaque messager à<br />

la possibilité de donner naissance à plusieurs protéines. La plupart du temps, l’initiation de la<br />

traduction se fait à partir d’un codon AUG. Or, il ne faut toutefois pas exclure les initiations<br />

exceptionnelles se faisant à partir de séquences permettant l’entrée des ribosomes de manière<br />

indépendante au codon AUG comme, par exemple les IRES. Ces deux phénomènes génèrent<br />

plusieurs isoformes protéiques à partir d’un même transcrit.<br />

Toutes ces diversités vont moduler la stabilité, la localisation et l’efficacité de la traduction des<br />

messagers.<br />

En résumé, la régulation d’un gène est contrôlée au niveau de:<br />

- la chromatine par des phénomènes de méthylation.<br />

- la transcription par sa région promotrice qui lui permet de fixer des facteurs de transcription<br />

modulant son expression.<br />

- la maturation des pré-messagers par la mise en place de la coiffe et de la queue polyA ainsi que les<br />

mécanismes d’épissage alternatif.<br />

- les initiations variables de la traduction<br />

- les différentes régulations des régions UTR (5’et 3’ UnTranslated Region)<br />

- les étapes post-traductionnelles.<br />

<strong>EPHE</strong> Banque de Monographies SVT 5


Dans la première partie de cette introduction, nous rappellerons brièvement les différentes étapes de la<br />

régulation de la transcription en utilisant des exemples précis concernant des gènes impliqués dans le<br />

développement et la pathologie du tissu musculaire. Lors de notre étude du gène CKIP-1, nous avons<br />

été confrontés à certains de ces processus de régulation de l’expression d’un gène. Ces résultats<br />

seront présentés et discutés après une présentation des mécanismes moléculaires de la différenciation<br />

musculaire dans lesquels CKIP-1 est impliqué.<br />

I – Régulation de la Transcription<br />

La transcription aboutit à la synthèse de l’ARN messager (ARNm) à partir du brin négatif de la<br />

molécule d’ADN. Cette étape a lieu dans le noyau des cellules eucaryotes.<br />

1- Structure d’un gène<br />

Un gène est généralement composé de quatre parties bien distinctes :<br />

- La première partie correspond au promoteur.<br />

Ce promoteur est composé d’un promoteur proximal (ou minimal) et d’un promoteur distal. Le<br />

promoteur proximal correspond à l’ensemble des éléments régulateurs permettant la fixation indirecte<br />

de l’ARN polymérase II. Les éléments régulateurs sont situés en amont du site d’initiation de la<br />

transcription et sont indispensables à sa reconnaissance. Le promoteur distal, quant à lui, possède des<br />

séquences reconnues par différents facteurs de transcription qui agiront comme des trans-activateurs<br />

ou des trans-répresseurs selon les signaux reçus par la cellule.<br />

- La seconde partie correspond à la région 5’ UTR.<br />

Elle est bornée par le site d’initiation de la transcription (+1) et le codon d’initiation de la traduction<br />

(ATG).<br />

- La troisième partie correspond à une séquence codante discontinue. Cette séquence<br />

contient des exons qui possèdent l’information génétique et codent pour la protéine ainsi que des<br />

introns qui s’intercalent entre les différents exons. Ces séquences seront transcrites mais pas traduites.<br />

Elles peuvent posséder des éléments régulateurs de la transcription (enhancers ou silencers).<br />

- La dernière partie du gène correspond à une région 3’ transcrite mais non traduite<br />

(3’UTR) qui se situe en aval de la séquence codante précédemment décrite. Cette partie contient la<br />

séquence génomique 5’AATAAA3’ appelée signal de polyadénylation qui sera interpretée par l’ARN<br />

polymérase comme un signal de fin de la transcription<br />

2- Eléments régulateurs de la transcription dans le promoteur minimal<br />

<strong>EPHE</strong> Banque de Monographies SVT 6


Parmi les plus fréquemment utilisés, on retrouve la boîte TATA présente dans la majorité des gènes.<br />

Cependant, certains promoteurs contiennent d’autres éléments permettant l’initiation de la<br />

transcription comme la boîte TATA : l’Inr, le DPE et le BRE. Dans certains promoteurs, aucun de ces<br />

sites remarquables n’est retrouvé.<br />

2-1- Promoteurs avec boîte TATA (ou boîte Goldberg-Hogness)<br />

La séquence de la boîte TATA est riche en A et T et son motif consensus est : 5’TATAAA3’. Cette<br />

boîte TATA est située à –30 nucléotides en amont du site d’initiation de la transcription. Ce motif<br />

TATA permet la fixation de l’ARN polymérase II sur l’ADN par l’intermédiaire de la protéine TBP<br />

(TATA Binding protein). Cette protéine appartient avec les TAFs (TBP Associated Factors) au<br />

complexe multiprotéique de pré-initiation de la transcription TFIID.<br />

2-1-1- Mise en place du complexe de pré-initiation de la transcription<br />

Lors de l’initiation de la transcription, le complexe multiprotéique TFIID (Transcriptional Factor II D)<br />

se fixe par l’intermédiaire de la protéine TBP (TATA-binding protein) sur la boîte TATA, constituée<br />

d’une séquence riche en T et A et située 30 nucléotides en amont du premier nucléotide qui sera<br />

transcrit. La fixation de ce complexe multiprotéique permet la reconnaissance du site de démarrage de<br />

la transcription par l’ARN polymérase II. Le complexe I, constitué de TFIID sur la boîte TATA,<br />

s’associe à TFIIB et génère le complexe II. L’addition de TFIIF à ce complexe permet l’entrée de<br />

l’ARN polymérase II en aval de la région TATA et permet la formation du complexe III. Ce nouveau<br />

complexe ainsi formé va permettre l’association de TFIIE et TFIIH pour faire le complexe V. Ces<br />

derniers auraient pour rôle de dénaturer la double hélice d’ADN au site d’initiation de la transcription<br />

grâce à leur activité hélicase. Cependant, des études récentes ont montré que l’entrée de TFIIH dans<br />

le cycle de transcription dépend de l’association du complexe III avec TFIIE et donc implique la<br />

présence d’un complexe intermédiaire (complexe IV) [1]. Ces études nous permettent juste de dire<br />

qu’une coopération entre TFIIE, TFIIH et le complexe de pré-initiation (complexe III) est<br />

indispensable pour former le complexe V. Ce dernier quand il est associé à TFIIJ forme le complexe<br />

VI. TFIIA, quant à lui, semble pouvoir s’associer avec tous les complexes intermédiaires de préinitiation.<br />

Des études ont montré que seule la présence du complexe I est nécessaire à l’association de<br />

TFIIA. TFIIA se lie donc de manière dépendante à TFIID en amont de la région TATA. Son effet<br />

semble être indirect sur la transcription et son rôle consiste probablement à induire un changement de<br />

conformation d’un état inactif de TFIID à un état actif.<br />

2-1-2- Les différentes boîtes pouvant être associées à la boîte TATA<br />

La boîte CCAAT se trouve en amont de la boîte TATA, entre la position –120 et la position -80<br />

nucléotides du site de démarrage de la transcription. La modification de cette boîte a permis de<br />

montrer qu’elle est indispensable pour accentuer la vitesse de transcription des gènes la contenant.<br />

<strong>EPHE</strong> Banque de Monographies SVT 7


Cette boîte peut se trouver sur le brin sens comme sur le brin antisens. Dans ce dernier cas, elle est<br />

alors sous sa forme complémentaire sur le brin sens, c’est-à-dire : 5’ATTGG3’. Sa séquence permet<br />

d’interagir avec un facteur trans-régulateur appelé CTF (CCAAT binding Transcription Factor) isolé<br />

de cellules de mammifères.<br />

La boîte GC est formée d’éléments riches en bases G et C. Si elle est présente, elle est localisée en<br />

principe entre la boîte TATA et la boîte CCAAT. Le motif riche en GC est généralement unique en<br />

présence d’une boîte TATA. Sa séquence permet la fixation du facteur de transcription Sp-1.<br />

Cependant la protéine Sp-1 ne se lie pas forcément de manière égale à toutes les boîtes GC [2]. En<br />

effet, ces séquences seraient sensibles à la méthylation au niveau de leur cytosine.<br />

2-1-3- Autres éléments initiateurs de la transcription pouvant être associés à la<br />

boîte TATA<br />

Certains promoteurs ayant une boîte TATA peuvent également posséder d’autres éléments initiateurs<br />

de la transcription<br />

L’élément initiateur Inr correspond à un motif qui chevauche le site d’initiation de la transcription<br />

et dont la séquence consensus est la suivante :<br />

5’YYA N(T/A)YY3’ chez les mammifères.<br />

+1<br />

N = nucléotides<br />

Y = pyrimidine<br />

Des études ont montré que l’Inr semble ne pas être important ni pour la localisation du site de<br />

démarrage de la transcription ni pour la direction de la transcription. Deux hypothèses ont été<br />

avancées. Dans la première, si l’affinité de liaison ADN-protéines est forte, l’Inr pourrait augmenter<br />

l’intensité du promoteur dans le cas d’une boîte TATA bien localisée et jouer le rôle d’activateur.<br />

Dans la seconde hypothèse, l’Inr serait reconnu comme un simple élément de la machinerie<br />

transcriptionnelle. Ainsi comme la boîte TATA facilite un haut niveau de transcription, l’Inr en aval<br />

de cette dernière conduirait à un très fort niveau basal de transcription [3]<br />

L’élément BRE (IIB Recognition Element)<br />

La séquence consensus du BRE est 5’(G/C)(G/C)(G/A)CGCC3’. Elle est immédiatement suivie du<br />

5’T de la séquence consensus 5’TATAA3’ constituant la boîte TATA [4]. Elle est reconnue par le<br />

facteur de transcription TFIIB par son motif hélice-boucle-hélice de liaison à l’ADN. Plus la<br />

séquence consensus est conservée in vitro, plus le facteur TFIIB se fixe à celle-ci pour permettre<br />

l’assemblage du complexe de pré-initiation et donc l’initiation de la transcription. Des études ont<br />

<strong>EPHE</strong> Banque de Monographies SVT 8


montré que l’interaction TFIIB-BRE pourrait jouer un rôle dans :<br />

- la détermination de l’activité globale transcriptionnelle du promoteur,<br />

- l’ordre d’assemblage du complexe de pré-initiation à un promoteur,<br />

- l’étape limitante dans l’initiation de la transcription d’un promoteur,<br />

- la sensibilité d’un promoteur envers des activateurs transcriptionnels<br />

spécifiques.<br />

BRE semble également être capable de déterminer la direction amont/aval de l’assemblage du<br />

complexe de pré-initiation ainsi que de l’initiation de la transcription en présence de l’interaction<br />

TBP-boîte TATA.<br />

2-1-4- Conclusion<br />

En conclusion, l’initiation de la transcription pour un promoteur avec une boîte TATA peut se faire<br />

par :<br />

(1) la boîte TATA seule, localisée en position –30 par rapport au site de démarrage de la transcription<br />

et reconnue par la TBP.<br />

(2) la boîte TATA en combinaison avec d’autres éléments :<br />

- l’élément initiateur Inr, localisé près de la position –1.<br />

- l’élément BRE (IIB Recognition Element), localisé en position –7 de la boîte TATA et reconnu par<br />

TFIIB.<br />

Toutefois, on ne peut pas écarter la possibilité que des séquences régulatrices présentes dans les<br />

promoteurs distaux puissent réguler spécifiquement la transcription par interaction avec la boîte<br />

TATA ou les éléments Inr ou BRE présents dans le promoteur proximal.<br />

2-2- Promoteur dépourvu de boîte TATA<br />

La boîte TATA n’est pas indispensable car la majorité des gènes constitutifs ou domestiques<br />

(housekeeping genes) n’en possèdent pas. Des études ont montré que des délétions ou des mutations<br />

de la boîte TATA n’abolissent pas totalement la transcription. Les deux effets observés sont : une<br />

diminution du taux de transcription et une perte de la fidélité du site d’initiation.<br />

2-2-1- La boîte GC<br />

En l’absence de boîte TATA, la séquence de type 5’GGGCGG3’, située de manière variable, et<br />

connue sous le nom de boîte GC semble pouvoir la remplacer. Le motif riche en GC est généralement<br />

répété plusieurs fois. Le facteur trans-régulateur le plus connu pour se fixer dessus est la protéine Sp-<br />

1. Ce facteur de transcription est un activateur ubiquitaire. Il est requis pour l’expression constitutive<br />

et inductible d’un grand nombre de gènes. Les études qui ont permis de mettre en évidence le rôle de<br />

Sp-1 ont été réalisé dans le virus SV40. Les auteurs ont montré que Sp1 lie sélectivement une<br />

<strong>EPHE</strong> Banque de Monographies SVT 9


séquence riche en GC, présente en 6 répétitions d’hexanucléotides dans le promoteur proximal du<br />

virus SV40 [5].<br />

Depuis, d’autres études ont montré qu’une grande variété de promoteurs cellulaires et viraux<br />

contenaient des boîtes GC et qu’elles pouvaient être activées par Sp-1 in vitro. Ces boîtes GC sont<br />

souvent retrouvées près de sites de liaisons à d’autres facteurs de transcription, suggérant que ces<br />

facteurs pourraient agir en coopération pour moduler la transcription. C’est le cas du promoteur à<br />

l’IGFBP-2 (Insulin-like Growth Factor-Binding Protein-2) [2] du rat qui tout en étant dépourvu de<br />

boîte TATA ainsi que de boîte CCAAT, possède cependant une région riche en GC dans sa partie<br />

proximale. Cette région contient quatre boîtes GC, dont trois sont très proches les unes des autres.<br />

Elles peuvent être toutes des sites potentiels de fixation du facteur de transcription Sp-1. Une étude a<br />

démontré que la fixation de Sp-1 aux trois plus proches boîtes GC était essentielle pour l’activité<br />

promotrice. Cependant, la fixation de facteurs de transcription à leur site consensus situés en amont<br />

est nécessaire pour l’expression du gène. Bien que des études aient démontré que Sp-1 est nécessaire<br />

pour atteindre un niveau basal de la machinerie transcriptionnelle et qu’il semble indispensable pour<br />

obtenir une activité maximale des promoteurs chez les mammifères, on ignore toujours si cette<br />

transcription est activement régulée dans les cellules de mammifères ou si elle est simplement<br />

influencée par la quantité de protéine Sp-1 contenue dans le noyau [6, 7].<br />

2-2-2- Rôle de l’Inr en absence de boîte TATA<br />

L’élément initiateur, Inr, en absence de boîte TATA, aurait pour rôle de guider l’ARN polymérase II<br />

vers un site de démarrage de la transcription et peut donc permettre l’initiation de la transcription à<br />

partir d’un site unique.<br />

L’Inr pourrait également influencer la direction de la transcription en absence de boîte TATA [3].<br />

L’initiation de la transcription par l’intermédiaire d’une séquence Inr fait intervenir le facteur TFIID<br />

[8].<br />

Les promoteurs dépourvus de boîte TATA n’ont pas tous un élément initiateur mais ils possèdent<br />

d’autres éléments activateurs capables de permettre l’initiation de la transcription :<br />

2-2-3- L’élément DPE (Downstream Promoter Element)<br />

Le DPE est un site de reconnaissance de TFIID fréquemment trouvé dans les promoteurs dépourvus<br />

de boîte TATA. En effet, parmi les 205 éléments régulateurs de la transcription chez Drosophila<br />

melanogaster, il a été estimé : que 29% des promoteurs contiennent une boîte TATA (sans DPE),<br />

26% contiennent un élément DPE (sans boîte TATA), 14% contiennent les motifs DPE et TATA et<br />

31% ne contiennent ni l’un ni l’autre. La séquence DPE est conservée de Drosophila melanogaster à<br />

l’Homme et semble être aussi commune que la boîte TATA.<br />

Sa séquence consensus est localisée entre la position +28 et +32: 5’(A/G)G(A/T)(C/T)(G/A/C)3’ [5].<br />

Par rapport au site d’initiation de la transcription. Des études ont montré une coopération entre les<br />

<strong>EPHE</strong> Banque de Monographies SVT 10


motifs Inr et DPE. Ainsi, une mutation dans le motif Inr ou dans le motif DPE entraîne une forte<br />

diminution de l’activité du promoteur. Il en est de même dans le cas d’une insertion ou d’une délétion<br />

de nucléotides dans ces deux motifs. Ces observations indiquent que la transcription basale<br />

dépendante de DPE implique une liaison coopérative de TFIID (et plus précisément de certaines<br />

TAFs) avec les motifs DPE et Inr [9]. De plus, il a été montré que si l’on inactive le motif TATA<br />

d’un promoteur, son activité transcriptionnelle est totalement restaurée si l’on ajoute à ce dernier la<br />

séquence DPE dans sa position originelle (à +28 nucléotides du site de démarrage de la transcription)<br />

[10].<br />

2-2-4- L’élément BRE (IIB Recognition Element)<br />

Le motif BRE, quant à lui, joue un rôle important en absence de boîte TATA car il interagit avec<br />

TFIIB. En effet, des études ont montré que cette interaction pourrait avoir un rôle dominant dans<br />

l’assemblage du complexe de pré-initiation de la transcription mais aussi dans l’initiation de la<br />

transcription d’un promoteur dépourvu de boîte TATA. De plus, lors d’une recherche dans des bases<br />

de données de promoteurs eucaryotes, le motif BRE apparaît à une fréquence significative dans des<br />

promoteurs sans boîte TATA [4].<br />

2-2-5- Conclusion<br />

En conclusion, l’initiation de la transcription pour un promoteur dépourvu de boîte TATA peut se<br />

faire par :<br />

- la ou les boîtes GC reconnue(s) par le facteur de transcription ubiquitaire Sp-1.<br />

- l’élément initiateur Inr combiné ou non avec l’élément DPE.<br />

- l’élément BRE, localisé en position –37<br />

Tous les promoteurs n’étant pas isolés, il est difficile d’estimer la représentation des différents motifs<br />

dans les promoteurs proximaux. Cependant, il est maintenant clairement établi que le promoteur<br />

proximal ne dirige pas seulement le démarrage de la transcription. Il joue également un rôle crucial<br />

dans la régulation de la transcription en collaboration avec le promoteur distal.<br />

3- Eléments régulateurs de la transcription dans le promoteur distal<br />

Le promoteur distal présente des séquences régulatrices spécifiques de chaque gène. Ces motifs<br />

spécifiques sont reconnus spécifiquement par des facteurs de transcription. Ces facteurs recrutent, par<br />

des interactions protéines-protéines avec d’autres facteurs de transcription et/ou des co-facteurs, la<br />

machinerie basale de la transcription et ainsi régulent la transcription<br />

Les séquences cis-régulatrices du gène qui permettent la fixation de facteur trans-régulateurs ont des<br />

effets sur la vitesse de la transcription. En effet, le taux de transcription du gène peut être<br />

<strong>EPHE</strong> Banque de Monographies SVT 11


usquement modifié positivement si l’on est en présence d’une séquence activatrice (enhancer) ou<br />

négativement si l’on est en présence d’une séquence inhibitrice (silencer). Ce mécanisme régulateur<br />

dépend le plus souvent de circonstances physiologiques. Il permet d’ajuster le taux de transcription<br />

aux besoins cellulaires.<br />

Les cellules répondent donc à des signaux (intra et extra-cellulaires) en activant ou réprimant certains<br />

gènes, ainsi qu’en modulant l’importance de la transcription des gènes actifs. La transcription d’un<br />

gène est donc régulée par les facteurs de transcription qui se fixent aussi bien sur le promoteur<br />

proximal que sur le promoteur distal. Cette régulation aboutit à la synthèse d’un ARN pré-messager.<br />

En effet, chez les eucaryotes, l’ARN subit une maturation post-transcriptionnnelle au niveau du noyau<br />

avant d’être traduit en protéine dans le cytoplasme.<br />

II- Maturation des ARN pré-messagers<br />

L’ARN messager chez les eucaryotes va subir de nombreuses modifications post-transcriptionnnelles.<br />

Les exons comme les introns sont transcrits pour donner une longue molécule d’ARN appelée<br />

transcrit primaire ou précurseur de l’ARNm (pré-ARNm). L’ARNm va se voir rajouté une coiffe dans<br />

sa région 5’, une série d’adénosines dans sa région 3’ et va subir un mécanisme d’excision-épissage.<br />

Ces modifications se font dans le noyau. Elles se déroulent au cours de l’étape de transcription et<br />

aboutissent à la maturation de l’ARNm. Elles sont dépendantes les unes des autres, comme nous le<br />

verrons dans le paragraphe III-1.<br />

1- La coiffe<br />

La mise en place de la coiffe ou ²capping² est la première étape de maturation du messager.<br />

La coiffe ou ²cap² est un 7-methyl-guanosine c’est-à-dire un GMP (Guanosine Mono-Phosphate)<br />

ayant un groupement méthyl sur l’atome d’azote en position 7.<br />

Elle se met en place dès le début de la transcription, avant que 30 nucléotides ne soient assemblés.<br />

Elle est reliée au premier nucléotide du transcrit primaire par une liaison phosphoanhydre. En effet, le<br />

groupement tri-phosphate du premier nucléotide est hydrolysé en di-phosphate par une ARN 5’ triphosphatase.<br />

Une guanylyltransférase catalyse la liaison GMP avec le premier nucléotide diphosphate,<br />

créant une liaison 5’-5’ triphosphate. Une méthyltransférase méthyle ensuite l’atome<br />

d’azote en position 7 du GMP.<br />

D’autres modifications peuvent également se produire, telle une méthylation de l’OH en 2’ des<br />

riboses situés sur les deux premiers nucléotides de l’extrémité 5’ du transcrit primaire. L’ARNm<br />

n’aura donc plus une extrémité 5’ phosphate libre. La coiffe protègerait ainsi l’extrémité 5’ des<br />

ARNm de l’attaque par des enzymes (phosphatases, nucléases). La coiffe joue également un rôle<br />

important dans la reconnaissance des ARN. Enfin, elle est nécessaire pour la liaison de la petite sousunité<br />

du ribosome qui assurera par la suite le processus de traduction.<br />

<strong>EPHE</strong> Banque de Monographies SVT 12


2- La queue polyA<br />

La polyadénylation s’effectue immédiatement après que le messager a été transcrit.<br />

En effet, une fois synthétisés, les ARN messagers sont clivés dans leur partie 3’ une vingtaine de<br />

bases en aval de la séquence AAUAAA. Cette séquence est reconnue par la protéine de clivage CPSF<br />

(Cleavage Polyadenylation Specificity Factor) et est suivie d’une seconde séquence riche en GU ou en<br />

U reconnue par une autre protéine de clivage CstF (Cleavage stimulating Factor). Ces facteurs, en<br />

association avec les protéines de clivages CFI et CFII (Cleavage Factor I and II) et la polyA<br />

polymérase (PAP), clivent l’ARN pré-messager et permettent l’addition d’environ 250 adénosines<br />

consécutives. Par la suite une protéine de 70kDa, la PABPII (PolyA Binding Protein II) se fixe sur la<br />

queue polyA. La queue polyA (associée à la PABP) semble jouer un rôle dans la stabilisation des<br />

messagers et dans l’initiation de la traduction [11, 12].<br />

3- L’excision-épissage des introns<br />

Elle consiste en l’élimination de toutes les séquences introniques du transcrit primaire. Ce mécanisme<br />

est commun à la grande majorité des ARN messagers. Le premier élément dans la connaissance des<br />

mécanismes de l’épissage fut la mise en évidence de séquences dinucléotidiques, appelées séquences<br />

consensus retrouvées aux extrémités des introns. Ces dinucléotides sont GU en 5’ et AG en 3’ de<br />

l’intron (règle de Breathnatch.R et Chambon.P). Des expériences de mutagenèse ont confirmé<br />

l’importance de ces séquences. De plus, des expériences d’épissage in vitro ont permis de montrer<br />

que l’intron formait une structure en lasso au cours de l’épissage.<br />

3-1- Mécanisme d’excision-épissage constitutif<br />

Les éléments qui jouent un rôle important lors de l’excision-épissage du transcrit primaire sont [12] :<br />

- La région 5’ de la jonction exon-intron qui possède la séquence consensus : AG/GURAGU<br />

(R= purines). La séquence dinucléotidique GU de l’intron est appelé site donneur d’épissage.<br />

- La région 3’ de la jonction intron-exon contenant un motif YAG/RNNN. La séquence AG se trouve<br />

dans l’intron et est appelé site accepteur d’épissage.<br />

- Le site de branchement du lasso qui est : CURA20HY. Il se trouve à peu près à 100 nucléotides en<br />

amont du site accepteur d’épissage. Dans ce motif, le nucléotide adénosine (A) suivi des<br />

pyrimidines (Y) est très conservé.Le mécanisme d’épissage peut être décomposé en 2 étapes de<br />

trans-estérification et nécessite aussi la présence de petits ARN de type snRNA (small nuclear<br />

RNA). Ces petits ARN agissent sous forme de complexes avec des protéines et sont alors<br />

nommés : snRNP (small nuclear RiboNucleoprotein Particles). Plusieurs types de snRNP existent,<br />

ils diffèrent par leur structure mais ils sont tous riches en uracile: U1, U2, U3, U4, U5, U6. Dans<br />

un premier temps, l’ARN U1 s’hybride au niveau du site donneur de l’ARN messager par<br />

<strong>EPHE</strong> Banque de Monographies SVT 13


homologie de séquence et en présence du facteur d’épissage de la famille des phosphoprotéines<br />

SR (Sérine Arginine): SF2. Cette fixation permet :- l’initiation de l’assemblage du "spliceosome"<br />

au niveau de l’intron à éliminer - la coupure en 5’ du G de la séquence consensus GU. L’ARN U2<br />

se fixe ensuite au niveau du site de branchement ; cette fixation nécessite un autre facteur<br />

protéique : U2AF (U2 small nuclear ribonucleoprotein Auxiliary Factor). L’extrémité 5’ libérée<br />

du site donneur subit une liaison phosphodiester un peu particulière avec le 2’OH du ribose de<br />

l’adénosine du site de branchement auquel s’est fixé l’ARN U2. A cette structure sont associés U4<br />

et U6. L’ARN U5 s’est fixé au niveau du site accepteur d’épissage. La première étape consiste<br />

donc en la formation du lasso à proprement parlé.Dans un second temps, le premier exon, bien<br />

que coupé, reste associé à l’intron via des protéines. La formation du "spliceosome" fait que<br />

l’extrémité 3’OH libre de l’exon se trouve en face du site accepteur. Une seconde réaction de<br />

trans-estérification va entraîner sa ligation à l’extrémité 5’ de l’exon suivant. La seconde étape du<br />

mécanisme d’épissage a donc pour but de raccorder puis fusionner les deux exons et d’induire la<br />

libération de l’intron sous forme de lasso [12, 13].<br />

3-2- Mécanisme d’épissage alternatif<br />

L’épissage est dit alternatif lorsque les messagers résultent de l’utilisation alternative de sites<br />

accepteurs et/ou donneurs d’épissage "faibles" pouvant conduire, après traduction, à des protéines<br />

différentes. Ces sites d’épissage "faibles" (par opposition aux sites d’épissage constitutifs) sont<br />

reconnus dans certaines conditions et conduisent à l’addition ou l’exclusion d’exon(s), la rétention<br />

entière ou partielle d’intron(s) ou d’exon(s). Ce mécanisme permet d’augmenter la capacité de codage<br />

des gènes et il se rencontre en particulier dans les gènes impliqués dans la physiologie du cerveau et<br />

du muscle.<br />

3-3- Importance de l’épissage alternatif dans la myogenèse<br />

3-3-1- Le facteur de transcription MEF2 et l’intégrine b1<br />

Les gènes MRF (Myogenic Regulatory Factor) de la famille MyoD régulent le programme de<br />

différenciation du muscle squelettique. Il existe quatre facteurs régulateurs du muscle (MRF) de la<br />

famille MyoD : la myogénine, MRF4, Myf5 et MyoD lui-même. Ces facteurs de transcription ont des<br />

motifs de type hélice-boucle-hélice (helix-loop-helix) qui se lient sur une séquence spécifique de<br />

l’ADN, appelée boîte E, après hétérodimérisation. Des expériences d’inactivation par recombinaison<br />

homologue chez la souris ont montré que MyoD et Myf5 ont des rôles partiellement chevauchant<br />

dans la détermination des cellules précurseurs du muscle, alors que la myogénine apparaît être<br />

essentielle pour la différenciation de ces cellules en cellules musculaires. Si des cellules non<br />

musculaires sont transfectées avec un des MRF, elles vont soit se transformer en cellules<br />

myogéniques soit ne pas exprimer le phénotype musculaire, tout dépend du type de cellules analysées.<br />

L’étude des cellules NIH3T3 [14] montrent qu’elles subissent une transformation myogénique<br />

<strong>EPHE</strong> Banque de Monographies SVT 14


incomplète après transfection avec les différents MRF. En effet, ces cellules transfectées sortent du<br />

cycle cellulaire et expriment les marqueurs moléculaires de la différenciation mais ne rentrent pas en<br />

différenciation terminale, c’est-à-dire qu’elles ne forment pas de myotubes multinuclés.<br />

L’incapacité à fusionner des cellules NIH3T3 transfectées par un membre de la famille MyoD est<br />

principalement due à l’impossibilité de générer, par épissage différentiel, les transcrits spécifiques du<br />

muscle comme la sous-unité de l’intégrine b1D et le facteur de transcription MEF2-D (Myocytespecific<br />

Enhancer Factor 2-D).<br />

Cette sous-unité b1D de l’intégrine est localisée dans le muscle squelettique au niveau de diverses<br />

structures d’adhésion où elle est en contact direct avec la taline et l’a-actinine [15]. Elle est associée<br />

dans le muscle squelettique adulte avec les sous-unités a7A et a7B de l’intégrine. Elle est exprimée<br />

après la fusion des myoblastes et son expression continue à augmenter pendant la croissance et la<br />

maturation des myotubes, par opposition avec l’isoforme b1A dont l’expression diminue pendant la<br />

myodifférenciation pour disparaître lorsque les myotubes différenciés arrivent à maturation (après la<br />

fusion des cellules). En effet, dans les myoblastes C2C12, b1A est progressivement remplacée par<br />

b1D. Le domaine cytoplasmique de la sous-unité b1D correspond à un épissage alternatif unique de<br />

50 acides aminés. Les 24 derniers acides aminés ajoutés par cet épissage sont codés par un nouvel<br />

exon du gène de l’intégrine b1. Parmi ces 24 acides aminés, 13 sont uniques et 11 sont conservés par<br />

comparaison avec l’isoforme b1A. Les deux isoformes possèdent deux motifs conservés NPXY à la<br />

même position. L’incapacité des cellules NIH3T3 surexprimant les MRF à fusionner est directement<br />

corrélée à un très faible niveau d’épissage alternatif de l’isoforme b1 D spécifique du muscle. Ces<br />

cellules présentent un épissage défectueux du gène MEF2-D.<br />

Le facteur de transcription MEF2-D appartient à la famille des Myocyte-specific Enhancer-binding<br />

Factor 2. Ce facteur de transcription se lie et active la transcription sous forme d’hétérodimères avec<br />

MEF2A et MEF2C, en reconnaissant une séquence d’ADN conservée riche en A/T :<br />

5’CTA(A/T) 4TA(G/A)3’. MEF2D lie cette séquence consensus avec une haute affinité et semble être<br />

un puissant activateur transcriptionnel. Ce facteur de transcription partage par la boîte MADS (qui<br />

permet la liaison à l’ADN et la dimérisation) et le domaine MEF2 une forte homologie d’acides<br />

aminés avec d’autres membres de la famille MEF2. L’ADNc codant MEF2D montre un cadre de<br />

lecture ouvert non interrompu de 514 acides aminés correspondant à une protéine de 55kDa.<br />

L’épissage alternatif de ce gène peut conduire à quatre transcrits : un sans les exon 1a et 1b ni l’exon<br />

2, un avec l’exon 1a, un avec l’exon 1b et un dernier avec l’exon 2. Ces différentes isoformes lient<br />

l’ADN de la même manière et ont des activités transcriptionnelles comparables dans les tissus où ils<br />

sont présents [16].<br />

Des études de son patron d’expression ont montré qu’il y avait prédominance du transcrit contenant<br />

l’exon 1b dans les myotubes C2C12 ainsi que dans le muscle squelettique. Les transcrits contenant<br />

l’exon 1a et l’exon 1b sont présents à des niveaux similaires dans le muscle cardiaque. Il a été montré<br />

que dans les cellules NIH3T3, l’épissage alternatif aboutissant à la forme MEF2D 1b spécifique du<br />

muscle est défectueux.<br />

<strong>EPHE</strong> Banque de Monographies SVT 15


En conclusion, les différentes isoformes de l’intégrine b1 et/ou du facteur de transcription MEF2 sont<br />

tissu-spécifiques et l’incapacité à générer les formes musculaires des ARNm de ces deux gènes dans<br />

les cellules NIH3T3 ne permet donc pas l’obtention du ²phénotype musculaire².<br />

L’épissage alternatif est donc un mécanisme qui génère une diversité protéique importante et présente<br />

une régulation complexe. Des anomalies de ce processus peuvent conduire à des disfonctionnements<br />

importants comme nous allons le voir dans le paragraphe suivant.<br />

3-3-2- Anomalie de l’épissage et pathologie musculaire<br />

3-3-2-1- Le gène MTMR1 (myotubularin-related 1)<br />

Le gène MTMR1 appartient à une famille de lipides phosphatases. Le premier membre de cette<br />

famille de gène, MTM1 code pour la myotubularine, une phosphatase spécifique du<br />

phosphatidylinositol 3-phosphate [PI(3)P]. MTM-1 est muté dans la myopathie myotubulaire liée à<br />

l’X (XLMTM) provoquant de sérieux désordres congénitaux qui affectent le muscle squelettique.<br />

MTM1 et MTMR1 sont homologues, adjacents sur le chromosome X et codent pour des protéines<br />

présentant 59% d’identité de séquence. Six isoformes d’ARNm de MTMR1 ont été mis en évidence<br />

par différents épissages alternatifs de trois exons (2.1, 2.2, 2.3) dans l’intron 2 du gène [17]. Les six<br />

isoformes issues des différents épissages alternatifs des trois exons supplémentaires sont :<br />

- A (absence des trois exons) et B (présence de l’exon 2.1). Ils sont ubiquitaires au stade<br />

embryonnaire.<br />

- C (présence des exons 2.1 et 2.2). Il est spécifique du muscle squelettique adulte.<br />

- D (présence des exons 2.1 , 2.2 et 2.3). Il se trouve dans le muscle et le cœur au stade embryonnaire<br />

tardif.<br />

- E (présence de l’exon 2.3) et F (présence des exons 2.1 et 2.3). Ils sont spécifiques du cerveau.<br />

L’isoforme C (contenant les exons 2.1 et 2.2) est majoritaire dans le muscle squelettique adulte et<br />

induite pendant la myogenèse aussi bien in vivo qu’in vitro. Les isoformes A et C de la protéine<br />

MTMR1 ont la même spécificité de substrat (PI(3)P) et montrent la même localisation sub-cellulaire.<br />

Buj-bello et col. ont montré que l’épissage alternatif conduisant à cette forme C spécifique du muscle<br />

est altéré dans une pathologie du muscle où de nombreuses pertubations d’épissages ont été décrites :<br />

la dystrophie myotonique (DM). Ceci aboutit à une réduction de cette isoforme et à la présence d’une<br />

nouvelle isoforme G. Dans des cellules ainsi que dans des tissus fœtaux DM, ce transcrit est anormal<br />

et ne contient que l’exon 2.2. Cet ARNm n’est pas affecté dans la myopathie myotubulaire liée à l’X<br />

(XLMTM). Cependant, l’importance de ce phénomène dans la pathologie DM n’est pas encore<br />

établie. D’autres défauts d’épissage ont été décrits pour les gènes IR (Insulin Receptor) et CIC-1<br />

(chloride channel) impliqués dans cette pathologie.<br />

3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)<br />

<strong>EPHE</strong> Banque de Monographies SVT 16


Chez les patients atteints de DM1, le transcrit du gène DMPK comporte des répétitions multiples de<br />

triplet CTG dans sa partie 3’UTR [18]. Ces ARNm mutants de DMPK contiennent jusqu’à milles<br />

répétitions CTG et la sévérité de la maladie est directement corrélée à la longueur de ces extensions.<br />

L’expression de DMPK dans les cellules DM1 est très faible. Il a été montré que la faible traduction<br />

de ces transcrits n’est pas due à un épissage défectueux mais à leur rétention dans le noyau. En effet,<br />

ces transcrits mutants sont accumulés au niveau du noyau et étroitement associés à la matrice<br />

nucléaire. Cette perte de fonction de DMPK dans les cellules DM1 est donc due à un mauvais export<br />

des ARNm et par conséquent à une traduction réduite de DMPK. Cependant, ce phénomène n’est pas<br />

directement responsable de la maladie. En effet, la maladie développée par les souris dont le gène<br />

DMPK a été inactivé par recombinaison homologue n’est pas similaire à DM1. Aucune autre<br />

mutation dans le gène DMPK n’a jamais été observée chez les patients DM1. De plus, la maladie<br />

DM2, une autre forme de dystrophie myotonique, phénotypiquement très proche de DM1, est causée<br />

par des extensions CCTG dans l’intron 1 du gène ZNF9. Le transcrit de ZNF9 est également retenu<br />

dans le noyau.<br />

Il a donc été suggéré que la présence de ces répétitions CUG dans ces ARNm (ARN (CUG)n ) est<br />

responsable de ces maladies indépendamment du locus considéré [19]. La ribonucléoprotéine<br />

nucléaire (hnRNP) CUG-BP fixe l’ARN et est impliquée dans la régulation de l’épissage alternatif<br />

d’ARNm spécifiques en se fixant sur des séquences introniques conservées contenant des éléments<br />

riches en U/G. Cette protéine est surexprimée dans les cellules DM1 et DM2, c’est à dire dans les<br />

cellules contenant des (ARN (CUG)n ). Le mécanisme de régulation de son expression par ces<br />

séquences CUG n’est pas connu. Les cibles spécifiques de CUG-BP sont entre autres, le gène du<br />

récepteur à l’insuline et le gène CIC-1 (chloride channel). L’accumulation nucléaire et donc la<br />

fixation de CUG-BP à des motifs U/G provoque des épissages aberrants. Par exemple, l’insertion<br />

d’un codon de terminaison prématuré entre deux exons aboutit à la perte d’expression de la protéine<br />

CIC-1 sauvage et à la myotonie. Dans le cas de IR, l’élimination de l’exon 11 de l’ARNm conduit à<br />

une isoforme courte du récepteur responsable de la résistance à l’insuline observée dans la pathologie<br />

DM.<br />

4- Promoteurs alternatifs<br />

Dans le cas de la synthèse de plusieurs ARNm à partir d’un même gène, deux possibilités se<br />

présentent quant à la régulation de la transcription : soit les transcrits sont régulés par les mécanismes<br />

que l’on vient d’illustrer précédemment, c’est-à-dire l’épissage alternatif, soit chacun d’eux est régulé<br />

sous le contrôle d’un promoteur distinct. Ce dernier mécanisme peut induire des différences<br />

d’épissage en fonction des espèces, des tissus d’expression ou même des conditions<br />

environnementales. Par conséquent, on peut rencontrer simultanément les deux mécanismes.<br />

Utilisation du promoteur spécifique du muscle (pM) de l’aldolase A<br />

La spécialisation des fibres musculaires squelettiques a lieu durant la période postnatale. Elle est<br />

caractérisée par la contractibilité (fibres rapides ou lentes) et par leur métabolisme qui est soit<br />

glycolytique soit oxydatif. Ces différences sont dues à la présence de différentes protéines contractiles<br />

<strong>EPHE</strong> Banque de Monographies SVT 17


et métaboliques. L’aldolase A est une enzyme glycolytique présente en grande quantité dans les fibres<br />

musculaires adultes rapides. Le gène murin codant pour l’enzyme glycolytique aldolase A est<br />

transcrit à partir de trois promoteurs alternatifs [20]: le promoteur pM muscle spécifique qui se situe<br />

entre les promoteurs pN et pH actifs dans la majorité des tissus y compris le muscle squeletique et<br />

cardiaque. Dans les cellules C2C12, le promoteur M est activé dans les 24 heures suivant l’induction<br />

de la différenciation et les trois promoteurs sont actifs dans les phases tardives de ce processus et le<br />

restent dans les myotubes différenciés [21]. Le promoteur pM est activé spécifiquement dans les<br />

fibres musculaires glycolytiques rapides et son niveau d’expression augmente durant la période<br />

postnatale de maturation du muscle. pM est beaucoup plus actif dans les muscles du corps que de la<br />

tête. Ce promoteur est activé en deux étapes : la spécificité de fibres est acquise très tôt durant la<br />

période après la naissance alors que la dichotomie corps/tête apparaît 15 jours après la naissance.<br />

Différents sites de fixation pour des facteurs de transcription ont été caractérisés dans cette région. La<br />

génération de souris transgéniques pour cette région, soit sous sa forme sauvage ou mutée pour<br />

certains des sites a montré que les sites de fixation requis pour l’expression dans les fibres rapides par<br />

rapport aux fibres lentes ainsi que ceux utilisés par différents types de fibres rapides sont différents.<br />

Ces résultats montrent que l’utilisation d’un promoteur alternatif permet de cibler l’expression d’un<br />

gène dans un tissu donné à un moment précis.<br />

III- Régions Régulatrices de l’ARN messager<br />

La régulation de l’expression d’un gène implique un contrôle de la transcription permettant d’aboutir<br />

à la maturation de l’ARN mais aussi à un contrôle post-transcriptionnel (c’est-à-dire le transport de<br />

l’ARNm du noyau vers le cytoplasme, l’efficacité de sa traduction, sa localisation cellulaire et sa<br />

stabilité). Ce dernier contrôle se fait principalement grâce à des éléments ARN généralement situés<br />

dans les régions transcrites mais non traduites de l’ARNm (à savoir le 5’ et le 3’ UTR)<br />

1. Interactions entre la coiffe, la séquence codante et la queue polyA<br />

Comme nous l’avons précisé précedemment, des études in vitro ont montré que la mise en place de la<br />

coiffe, de l’épissage et de la polyadénylation sont dépendantes les unes des autres.<br />

En particulier, il semble que la structure de la coiffe joue un rôle important au niveau du phénomène<br />

d’épissage. L’incubation in vitro d’un pré-ARNm dans un extrait nucléaire, montre que l’addition<br />

d’une coiffe augmente de façon significative la formation de l’ARNm épissé. L’interconnexion de la<br />

coiffe et de l’épissage est importante pour l’intron le plus proximal et diminue avec la distance. Cette<br />

étroite relation implique la protéine nucléaire CBC (Cap Binding Complex) associée à la coiffe.<br />

L’élimination de la protéine CBC d’extraits nucléaires entraîne une inhibition significative de<br />

l’épissage. Des études complémentaires ont montré que CBC influe de manière positive sur<br />

l’interaction du U6snRNA avec le site donneur d’épissage en affectant le remplacement du U1snRNP<br />

par U6 [12]. Ce mécanisme montre bien qu’un épissage efficace est dépendant de la coiffe.<br />

<strong>EPHE</strong> Banque de Monographies SVT 18


Il semble que la coiffe interfère également avec la polyadénylation. Des expériences similaires ont<br />

permis de montrer que la présence de CBC stabilise le complexe de polyadénylation en présence du<br />

transcrit primaire [22].<br />

Enfin, il existe deux liens étroits entre l’épissage et la polyadénylation<br />

- Le premier consiste en la délimitation des exons dans le mécanisme d’épissage de l’ARN. Pour les<br />

exons ²internes² au gène, les sites d’épissage 3’ et 5’ sont le plus souvent reconnus par des<br />

interactions entre les facteurs d’épissage aux bornes de l’exon. Ce mécanisme de délimitation des<br />

exons est également appliqué au dernier exon du gène, bien que dans ce cas le dernier exon soit<br />

délimité par le signal de polyadénylation. L’épissage et la polyadénylation à chaque extrémité de<br />

l’exon se régulent positivement entre eux. Cette régulation fait intervenir une interaction entre le<br />

facteur d’épissage U2AF et la polyA polymérase [23].<br />

- Le second lien qui existe entre l’épissage et la polyadénylation peut être mis en évidence dans le<br />

cas d’une polyadénylation alternative. En effet, la position de la queue polyA peut être variable<br />

s’il existe plusieurs sites de clivage dans la région 3’UTR de l’ARN pré-messager. Cette<br />

polyadénylation alternative peut conduire à l’expression de différents produits à partir d’un même<br />

gène. Deux exemples ont été bien caractérisés : le gène codant pour la chaîne lourde de<br />

l’immunoglobuline M (IgM) et le gène de la calcitonine [24].<br />

Le gène IgM possède un premier site de polyadénylation dans un intron qui est sujet à une répression<br />

par le site donneur d’épissage situé en amont. Ce site est finalement éliminé par épissage de l’intron<br />

le contenant. L’ARNm résultant utilise son second site de polyadénylation situé en aval, produisant<br />

ainsi la forme membranaire de la protéine, qui prédomine au cours du développement précoce des<br />

cellules B. Dans les cellules B matures, le premier site de polyadénylation, jusque-là réprimé, va être<br />

beaucoup plus sollicité, pour synthétiser une forme sécrétée plus courte de la protéine. Dans ces<br />

cellules, contrairement aux cellules B immatures, le facteur de polyadénylation CstF-64 (Cleavage<br />

stimulation Factor-64) est fortement exprimé et cette protéine a une haute affinité pour le plus court<br />

signal de polyadénylation. Elle entre donc en compétition avec le mécanisme d’épissage [25] et<br />

favorise ainsi la synthèse de la forme courte.<br />

Une situation similaire existe pour le gène de la calcitonine. Le transcrit du gène de la calcitonine<br />

subit un épissage alternatif spécifique de tissu qui conduit au messager de la calcitonine (dans la<br />

thyroïde) ou au messager d’un neuromédiateur, le CGRP (Calcitonin Gene Related Peptide) dans le<br />

cerveau. Il semble que cet épissage alternatif résulte de la présence, dans la thyroïde, d’un élément<br />

activateur (enhancer) impliqué dans le recrutement des facteurs d’épissage conduisant à la production<br />

de messagers de la calcitonine. Dans le cerveau, cet élément de régulation positif est présent, mais ne<br />

semble plus pouvoir agir. Ceci conduit à la production de CGRP plutôt qu’à la calcitonine [24].<br />

2. Régulation par la coiffe et la queue polyA [26]<br />

Les protéines qui interagissent avec la coiffe et la queue polyA induisent généralement deux<br />

<strong>EPHE</strong> Banque de Monographies SVT 19


processus de régulations supplémentaires. Le premier consiste en la reconnaissance de l’intégrité de<br />

l’ARNm par le système de surveillance. En effet, dans le cas où des anomalies seraient détectées, ce<br />

système empêche l’export de l’ARNm vers le cytoplasme. Le second mécanisme de régulation<br />

consiste en l’export de l’ARNm dans le cytoplasme à proprement parler. Les protéines mises en jeu<br />

lors de la reconnaissance de l’intégrité de l’ARNm vont interagir avec les protéines du pore nucléaire<br />

afin de permettre le transport de cet ARNm. Ces phases de régulation permettent la prise en charge<br />

d’un ARNm ²correct² par la machinerie traductionnelle.<br />

Dans le noyau, la protéine CBC se lie à la coiffe. Elle est composée de deux sous-unités : la sousunité<br />

CBP80 qui contient un NLS (Nuclear Import Signal) classique et la sous-unité CBP20 qui<br />

contient un domaine de liaison à l’ARN de type RNP. La protéine CBC est importante pour<br />

l’épissage du transcrit primaire mais aussi pour l’export de l’ARNm du noyau vers le cytoplasme<br />

grâce à des associations/dissociations avec les sous-unités des molécules d’importines a et b et les<br />

snRNA.<br />

La queue polyA, quant à elle, est associée à la PABPII qui semble jouer un rôle dans la stabilisation<br />

des messagers et dans l’initiation de la traduction.<br />

Une fois l’ARNm exporté vers le cytoplasme, les protéines CBC et PABPII vont être remplacées<br />

respectivement par le complexe eIF4-F (eukaryotic translation Initiation Factor 4-F) et par la protéine<br />

PABPI.<br />

Le complexe eIF4-F comprend trois sous-unités : eIF4-E qui est en contact direct avec la coiffe,<br />

eIF4-A qui possède une activité hélicase dépendante de l’ATP et eIF4-G (appelé aussi p220) qui<br />

permet l’assemblage du complexe d’initiation de la traduction. Ce complexe permet la traduction de<br />

l’ARNm.<br />

La protéine PABPI recouvre la queue polyA afin de lui servir de bouclier contre les attaques des<br />

ribonucléases de la cellule. Cette protéine va donc empêcher la dégradation de l’ARNm.<br />

3. Régulation par la région 5’UTR<br />

Rappelons que la région 5’UTR est délimitée par le site d’initiation de la transcription d’un côté et le<br />

site de démarrage de la traduction de l’autre. La distance qui sépare ces deux sites peut varier puisque<br />

dans un gène présentant plusieurs promoteurs, la transcription peut être initié à partir de plusieurs sites<br />

de démarrage différents. Ce phénomène conduirait donc à la synthèse de régions 5’UTR différentes<br />

pour un même ARNm. La région 5’UTR peut varier en taille car la traduction peut démarrer à<br />

différents sites, permettant ainsi la synthèse de protéines avec des régions N-terminal différentes.<br />

Une des premières régulations de la région 5’UTR est sa longueur. En effet, la distance entre la coiffe<br />

et le codon d’initiation de la traduction semble jouer un rôle sur l’efficacité de l’initiation de la<br />

traduction. La longueur minimale requise pour permettre la reconnaissance du premier codon AUG,<br />

est d’environ 20 nucléotides, mais elle peut être compensée par la présence de structures secondaires<br />

en aval de l’ATG [27]. Au-delà de 20 nucléotides, l’efficacité de l’initiation de la traduction<br />

augmente avec la taille. Ceci pourrait s’expliquer en partie par l’accumulation de nombreuses sousunités<br />

40S sur ces longs 5’UTR conférant ainsi un avantage pour la traduction. Des études ont montré<br />

<strong>EPHE</strong> Banque de Monographies SVT 20


qu’une région UTR riche en dinucléotides GC est néanmoins beaucoup plus courte qu’une région<br />

UTR pauvre en GC.<br />

Plusieurs éléments régulateurs post-transcriptionnels spécifiques à la région 5’UTR ont été décris.<br />

Ainsi, on peut retrouver en plus de la coiffe :<br />

- des IRES (Internal Ribosome Entry Site) ou sites internes d’entrée des ribosomes qui peuvent<br />

permettre la traduction de plusieurs protéines à partir d’un seul ARNm. L’IRES permet la traduction<br />

sans reconnaissance de la coiffe par le ribosome.<br />

- les uORF (upstream Open Reading Frame). Ce sont de petits cadres de lecture qui peuvent interférer<br />

avec le site préférentiel d’initiation de la traduction du gène considéré.<br />

- des structures secondaires en épingle à cheveux qui soit empêchent le balayage de l’ARNm par les<br />

ribosomes soit permettent l’interaction entre l’ARN et des protéines régulatrices pour moduler la<br />

traduction.<br />

3-1- IRES (Internal Ribosomal Entry Site)<br />

L’IRES est une structure d’initiation de la traduction qui ne nécessite pas la reconnaissance de la<br />

coiffe par le ribosome. L’activité IRES est dépendante non pas du codon d’initiation de la traduction<br />

(AUG) mais de structures secondaires ou tertiaires, de facteurs trans-activateurs, ou de séquences<br />

complémentaires à la sous-unité 18S de l’ARNr [28]. Cette initiation nécessite la présence des<br />

facteurs d’initiation de la traduction eIFs, à l’exception de eIF-4E (qui reconnaît spécifiquement la<br />

coiffe). La majorité des IRES sont d’origine virale. Seules quelques-unes ont été décrites comme étant<br />

d’origine cellulaire. Les séquences IRES cellulaires sont fréquemment activées lorsque la protéine<br />

normalement synthétisée (de manière coiffe dépendante) est inhibée.<br />

L’ARNm de c-myc comporte un long et complexe 5’UTR contenant un IRES. C-myc est un<br />

protooncogène impliqué dans la régulation de la prolifération et l’apoptose. L’activité de l’IRES cmyc<br />

dépend du type cellulaire et du stimulus appliqué à la cellule. Ainsi, lorsque la cellule entre en<br />

apoptose, la traduction dépendante de la coiffe diminue, probablement par le clivage de eIF-4G ainsi<br />

que d’autres facteurs de la traduction par les caspases et l’activité IRES augmente. D’autres gènes<br />

impliqués dans la régulation de l’apoptose contiennent un IRES dans leur extrémité 5’UTR. C’est le<br />

cas de Apaf-1 (Apoptosis protease activating factor-1) et de XIAP (X-linked Inhibitor Apoptosis<br />

Protein).<br />

Au cours de la phase G2/M du cycle cellulaire, la synthèse des protéines dépendante de la coiffe est<br />

inhibée. C’est le cas pour les protéines kinases PITSLRE qui appartiennent à la famille des kinases<br />

dépendantes des cyclines [29]. Elles agissent comme des gènes suppresseurs de tumeurs et ont été<br />

montré comme ayant un rôle dans la progression du cycle cellulaire. Deux isoformes des protéines<br />

kinases PITSLRE existent : p110 PITSLRE et p58 PITSLRE . p110 PITSLRE est produite par traduction<br />

dépendante de la coiffe alors que p58PITSLRE résulte d’une traduction dépendante d’une IRES. Lors<br />

de la phase G2/M du cycle cellulaire, l’ARNm des protéines kinases PITSLRE n’est pas traduit de<br />

manière dépendante à la coiffe. En effet, lorsque l’inhibition de la traduction dépendante de la coiffe<br />

<strong>EPHE</strong> Banque de Monographies SVT 21


est levée, seule la protéine p110 PITSLRE est synthétisée. En contrepartie, lorsque la traduction<br />

dépendante de la coiffe est inhibée, seule la protéine p58 PITSLRE est présente. Ces observations<br />

révèlent donc un nouveau mécanisme de régulation de la traduction pendant la progression du cyle<br />

cellulaire.<br />

En général, la traduction d’ARNm par l’intermédiaire d’un IRES est activée lorsque les conditions ne<br />

sont pas favorables à une traduction coiffe dépendante. C’est le cas de l’apoptose et de l’arrêt du<br />

cycle cellulaire.<br />

3-2- uORFs (upstream Open Reading Frame)<br />

Il semble que la reconnaissance de la séquence de l’ARNm par le complexe ribosomal nécessite en<br />

plus du contexte optimal du codon d’initiation de la traduction établit par Kozak : 5’GCCRCCaugG3’,<br />

des éléments régulateurs situés en 5’UTR [30]. C’est ainsi que les uORFs ont été décrits. Ce sont de<br />

petits cadres de lecture ouverts en amont de l’ATG. Tous les ARNm ne sont pas fonctionnels. Dans<br />

certains cas, ces transcrits sont traduits en quantité équivalente à l’ARN fonctionnel majoritaire. Dans<br />

d’autre cas, un transcrit incomplet peut parfois être plus abondant que l’ARN entièrement épissé et<br />

théoriquement traduisible.<br />

Après la reconnaissance et la traduction d’un uORF, le ribosome a quatre possibilités [31]:<br />

- Le ribosome reste associé à l’ARNm et continue à avancer sur le messager.<br />

- Le ribosome peut réinitier plus en aval après être resté associé et avoir avancé sur l’ARNm. Cette<br />

réinitiation peut se faire aussi bien à un codon AUG proximal qu’à un codon AUG distal. Les<br />

ribosomes traduisent souvent le petit cadre de lecture ouvert (uORF) et réinitient en aval avec une<br />

grande efficacité, n’affectant pas l’expression du gène considéré. Cependant, la taille du cadre de<br />

lecture (ORF) est un facteur limitant lors de réinitiation chez les eucaryotes. Cette réinitiation ne<br />

peut avoir lieu qu’après la traduction d’un premier cadre de lecture court mais en aucun cas après<br />

la traduction d’un premier cadre de lecture long et entier. La raison pour laquelle la réinitiation est<br />

fréquemment liée à la taille du premier cadre de lecture peut s’expliquer par le fait que certains<br />

facteurs impliqués dans l’initiation de la traduction se dissocient du ribosome progressivement<br />

pendant la phase d’élongation. Par conséquent, si la phase d’élongation est brève (dans le cas d’un<br />

premier cadre de lecture court), les facteurs requis pour la réinitiation d’un nouveau cadre de<br />

lecture seront présents. Ceci ne sera pas le cas, si la première initiation de la traduction a lieu à<br />

partir d’un cadre de lecture long et entier.<br />

- Le ribosome s’arrête en cours de la phase d’élongation ou de terminaison de la traduction de<br />

l’uORF, créant ainsi un blocus. Dans ce cas, la structure du peptide codée par l’uORF serait à<br />

l’origine de l’arrêt. Il semblerait que ce peptide interagisse avec la machinerie traductionnelle.<br />

Cette interaction semble perturber l’expression du gène lui-même et bloquer toute nouvelle<br />

traduction à partir d’un uORF plus en aval.<br />

- L’uORF synthétisée peut affecter l’expression du gène en altérant la stabilité de son messager. En<br />

effet, il semblerait qu’un complexe multiprotéique agisse au niveau de la terminaison de la<br />

traduction dans le but de réguler le devenir du ribosome et de l’ARNm. A ce moment là, l’uORF a<br />

<strong>EPHE</strong> Banque de Monographies SVT 22


la possibilité de provoquer la dégradation de l’ARNm et donc d’éliminer l’expression du gène. Le<br />

mécanisme qui entraîne cette dégradation est très mal connu.<br />

D’autre part, il existe des mécanismes qui éliminent les uORFs quand une forte synthèse de protéine<br />

est requise dans un tissu précis ou à un moment donné.<br />

En conclusion, les uORFs agissent au niveau de l’expression des gènes. Dans certains cas, ils servent<br />

d’éléments régulateurs importants.<br />

3-3- Présence de Structures Secondaires<br />

Le contrôle de la traduction d’un ARNm peut également être modulé par des interactions entre des<br />

séquences de réponse spécifiques à structures secondaires et des protéines régulatrices de l’initiation<br />

de la traduction, qui sont généralement des répresseurs. C’est le cas du facteur IRP1 (Iron Responsive<br />

Protein-1) [28]. Ce facteur se lie à un motif IRE (Iron Responsive Element) de manière dépendante à<br />

une homéostasie en fer dans la cellule. Le motif IRE correspond à une épingle à cheveux et est<br />

localisé près de la coiffe dans la région 5’UTR de l’ARNm de la ferritine. Cette protéine est requise<br />

pour le stockage du fer ainsi que pour son utilisation sauf lorsque le niveau en fer de la cellule est trop<br />

faible. En effet, si la quantité de fer intracellulaire est insuffisante, cela accroît l’activité de liaison de<br />

IRP1 à la structure en épingle à cheveux IRE. Ce complexe est stabilisé par IRP2 (Iron Responsive<br />

Protein-2). La liaison de IRP à IRE empêche l’accrochage du complexe ribosomale 40S à l’ARNm et<br />

donc inhibe fortement la traduction de la ferritine. Inversement, lorsque la concentration en fer est<br />

élevée, IRP2 est dégradée par le protéasome et IRP1 capture les ions fer, ce qui l’empêche de se lier<br />

au motif IRE. Dans ces conditions, les facteurs d’initiation à activité hélicase (eIFs) détruisent la<br />

structure en épingle à cheveux de l’IRE, et permettent l’entrée et la fixation à l’ARNm du complexe<br />

de pré-initiation 40S. Le ribosome ainsi assemblé peut donc entraîner l’initiation de la traduction.<br />

4. Régulation par la région 3’UTR<br />

La région 3’UTR se situe entre le codon de fin de la traduction et la queue polyA. Cette région peut<br />

être variable s’il existe plusieurs codons stop, des épissages alternatifs du dernier exon et un usage<br />

alternatif de sites de polyadénylation. On a pu constater que la région 3’UTR est impliquée dans la<br />

fixation de certains facteurs d’élongation (eIFs) ainsi que dans la réinitiation de la traduction en<br />

permettant de recycler les sous-unités ribosomales en direction de l’extrémité 5’ du même ARNm.<br />

Par conséquent, la région 3’UTR participe à l’optimisation de l’initiation de la traduction.<br />

Cette région est également impliquée dans le contrôle de la traduction, la localisation sub-cellulaire et<br />

la stabilité des messagers par l’intermédiaire d’éléments régulateurs tels que :<br />

- des éléments de polyadénylation cytoplasmique riches en U nommés CPE<br />

- des éléments de désadénylation riches en A + U nommés ARE (AU Rich Element)<br />

- des éléments de réponse (de type tige-boucle) à des facteurs spécifiques<br />

<strong>EPHE</strong> Banque de Monographies SVT 23


4-1- CPE (Cytoplasmic Polyadenylation Element)<br />

La présence et la taille de la queue polyA contribuent à l’efficacité de la traduction des ARNm. La<br />

longueur de la séquence polyA des ARNm cytoplasmiques varie. Elle est régie par un phénomène<br />

dynamique qui dépend de séquences spécifiques de l’ARNm ainsi que du type cellulaire, ceci<br />

indépendamment des événements nucléaires. La taille de la queue polyA de l’ARNm est réduite au<br />

cours du temps, mais la vitesse de désadénylation varie en fonction de l’ARNm, du type cellulaire et<br />

de l’efficacité de traduction. Des réactions de désadénylation précèdent la dégradation de l’ARNm.<br />

Dans certaines circonstances, des réactions de ré-adénylation peuvent se produire dans le cytoplasme.<br />

Ces réactions de ré-adénylation cytoplasmiques ont lieu au moment où l’ARNm devient traductible et<br />

est recruté par la machinerie traductionnelle. Ces réactions nécessitent le signal AAUAAA, le CPSF<br />

et la PAP, comme cela est le cas dans le noyau, mais aussi une séquence riche en résidus U, appelée<br />

CPE. Le mécanisme par lequel le motif CPE permet la fixation de la CPEB (CPE Binding protein)<br />

pour entraîner la polyadénylation cytoplasmique n’est pas encore clairement établi.<br />

4-2- ARE (AU Rich Element)<br />

On sait que la présence de la coiffe s’oppose à la digestion des ARNm par des exoribonucléases dans<br />

le sens 5’-3’. Deux mécanismes indiquent que la queue polyA protège également les ARNm de la<br />

dégradation. L’un de ces mécanismes a déjà été évoqué puisqu’il s’agit de l’interaction de la PABP<br />

sur la queue polyA, formant ainsi un complexe qui protège les ARNm polyadénylés contre leur<br />

digestion par les exoribonucléases dans le sens 3’-5’. Le second mécanisme correspond à l’étape qui<br />

précède la dégradation des ARNm : la désadénylation. Les séquences qui stimulent ce mécanisme et<br />

favorisent donc la dégradation des messagers sont des séquences riches en résidus A et U et sont<br />

localisées dans la région 3’UTR des messagers de courte durée de vie : les ARE. Aucune séquence<br />

consensus n’a été rigoureusement établie, mais une classification a été proposée, divisant les ARE en<br />

trois groupes [32].<br />

Le premier groupe est constitué par les séquences renfermant une ou plusieurs copies du motif<br />

pentamérique AUUUA (classe I) ou tétramérique AUUU (classe II), entouré de diverses répétitions de<br />

A et U, et couplé à une longue région continue riche en U.<br />

Le second groupe consiste en des séquences divisées en deux domaines dont un est formé par environ<br />

60% de A ou U et un autre domaine constitué par trois copies du motif pentamérique GUUUG.<br />

Le troisième groupe contient une continuité de U sans aucun pentamère.<br />

La seule protéine isolée capable de se fixer sur les ARE est : AUF1 (AU Factor 1). Sa fixation induit<br />

in vitro la déstabilisation des ARNm de c-myc et du GM-CSF par exemple. Cependant, il semble<br />

qu’il existe d’autres protéines non encore identifiées capables d’induire au contraire la stabilisation de<br />

ces messagers.<br />

L’ARE est donc reconnu par différents facteurs qui, selon leur nature, stabilisent ou déstabilisent<br />

l’ARNm. Ceci permet la synthèse de protéines à des moments précis dans de conditions particulières.<br />

<strong>EPHE</strong> Banque de Monographies SVT 24


4-3- Présence de Structures Secondaires<br />

Si l’on reprend le cas de la ferritine, on s’aperçoit que ce même élément de réponse au fer de type<br />

tige-boucle IRE est également présent en 5 exemplaires dans la région 3’UTR de l’ARNm du<br />

récepteur de la transferrine (TfR) [28]. En présence de faibles concentrations en fer, les protéines<br />

IRP1et IRP2 inhibent la traduction de l’ARNm de la ferritine. En revanche, ces protéines stabilisent<br />

l’ARNm codant pour la TfR. Ceci aboutit à une augmentation du taux de ce récepteur permettant<br />

ainsi à la cellule d’absorber le fer par endocytose de la transferrine. Inversement, lorsque la<br />

concentration en fer est élevée, les protéines IRP1 et IRP2 ne sont plus actives. En effet, elles<br />

n’empêchent plus la traduction du messager de la ferritine et par conséquent le stockage du fer dans la<br />

cellule. En parallèle, elles ne protègent plus la région 3’UTR de l’ARNm du récepteur à la<br />

transferrine. Cet ARNm est donc susceptible d’être dégradé par des endoribonucléases dans le sens<br />

3’-5’. Ainsi selon les stimuli reçus par la cellule ou les variations cellulaires, les ARNm présentant<br />

des séquences particulières dans leur région 3’UTR sont dégradés ou stabilisés afin qu’une protéine<br />

soit ou non synthétisée<br />

En conclusion, les séquences ou les structures présentes dans les régions 5’UTR et 3’UTR sont très<br />

importantes pour la stabilité et la localisation des messagers mais aussi pour l’efficacité de la<br />

traduction d’un messager.<br />

5. Conclusion<br />

Tous les mécanismes que nous avons évoqués ici, à savoir l’utilisation de promoteurs alternatifs, les<br />

mécanismes d’épissages alternatifs mais aussi les régulations par les régions 5’ et 3’ des ARN<br />

messagers, permettent une grande variabilité tant au niveau de l’ARNm qu’au niveau de la protéine.<br />

Ils sont importants et nécessaires car ils permettent l’expression d’une protéine à un moment donné<br />

dans une cellule définie. Ceci confirme bien l’hypothèse selon laquelle la complexité moléculaire se<br />

situe en aval des gènes (ou du génome) et plus particulièrement au niveau des étapes de la<br />

transcription et de la traduction. Cependant d’autres mécanismes, non évoqués ici, sont capables<br />

d’induire encore une plus grande diversité protéique en régulant l’état de la chromatine, l’édition des<br />

ARN, l’interférence par les ARN ou les modifications post-traductionnelles.<br />

La régulation de la myogenèse fait intervenir certains de ces mécanismes, comme nous l’avons vu à<br />

travers les exemples d’épissages et de promoteurs alternatifs.<br />

Au laboratoire, nous avons isolé une protéine impliquée dans la différenciation musculaire régulée<br />

par la voie de signalisation PI3-K: la protéine CKIP-1.<br />

BIBLIOGRAPHIE<br />

1. Flores O, Lu H, Reinberg D: Factors involved in specific transcription by mammalian<br />

RNA polymerase II. Identification and characterization of factor IIH. J Biol Chem 1992;<br />

267:2786-2793.<br />

<strong>EPHE</strong> Banque de Monographies SVT 25


2. Boisclair YR, Brown AL, Casola S, Rechler MM: Three clustered Sp1 sites are required for<br />

efficient transcription of the TATA-less promoter of the gene for insulin-like growth<br />

factor-binding protein-2 from the rat. J Biol Chem 1993; 268:24892-24901.<br />

3. O'Shea-Greenfield A, Smale ST: Roles of TATA and initiator elements in determining the<br />

start site location and direction of RNA polymerase II transcription. J Biol Chem 1992;<br />

267:6450.<br />

4. Lagrange T, Kapanidis AN, Tang H, Reinberg D, Ebright RH: New core promoter element<br />

in RNA polymerase II-dependent transcription: sequence-specific DNA binding by<br />

transcription factor IIB. Genes Dev 1998; 12:34-44.<br />

5. Kadonaga JT: The DPE, a core promoter element for transcription by RNA polymerase<br />

II. Exp Mol Med 2002; 34:259-264.<br />

6. Wang T, Lafuse WP, Zwilling BS: NFkappaB and Sp1 elements are necessary for maximal<br />

transcription of toll-like receptor 2 induced by Mycobacterium avium. J Immunol 2001;<br />

167:6924-6932.<br />

7. Lania L, Majello B, De Luca P: Transcriptional regulation by the Sp family proteins. Int J<br />

Biochem Cell Biol 1997; 29:1313-1323.<br />

8. Chalkley GE, Verrijzer CP: DNA binding sites selection by RNA ploymerase II TAFs: a<br />

TAFII250-TAFII150 complex recognizes the Initiator. Embo J 1999; 18:4835-4845.<br />

9. Burke TW, Kadonaga JT: The downstream core promoter element, DPE, is conserved<br />

from Drosophila to humans and is recognized by TAFII60 of Drosophila. Genes Dev<br />

1997; 11:3020-3031.<br />

10. Kutach AK, Kadonaga JT: The downstream promoter element DPE appears to be as<br />

widely used as the TATA box in Drosophila core promoters. Mol Cell Biol 2000; 20:4754-<br />

4764.<br />

11. Proudfoot NJ: Genetic dangers in poly(A) signals. EMBO Rep 2001; 2:891-892.<br />

12. Proudfoot NJ, Furger A, Dye MJ: Integrating mRNA processing with transcription. Cell<br />

2002; 108:501-512.<br />

13. Moore MJ, Sharp PA: Evidence for two active sites in the spliceosome provided by<br />

stereochemistry of pre-mRNA splicing. Nature 1993; 365:364-368.<br />

14. Russo S, Tomatis D, Collo G, Tarone G, Tato F: Myogenic conversion of NIH3T3 cells by<br />

exogenous MyoD family members: dissociation of terminal differentiation from myotube<br />

formation. J Cell Sci 1998; 111:691-700.<br />

15. Belkin AM, Zhidkova NI, Balzac F, Altruda F, Tomatis D, Maier A, Tarone G, Koteliansky<br />

VE, Burridge K: Beta 1D integrin displaces the beta 1A isoform in striated muscles:<br />

localization at junctional structures and signaling potential in nonmuscle cells. J Cell Biol<br />

1996; 132:211-226.<br />

16. Martin JF, Miano JM, Hustad CM, Copeland NG, Jenkins NA, Olson EN: A Mef2 gene that<br />

generates a muscle-specific isoform via alternative mRNA splicing. Mol Cell Biol 1994;<br />

14:1647-1656.<br />

17. Buj-Bello A, Furling D, Tronchere H, Laporte J, Lerouge T, Butler-Browne GS, Mandel JL:<br />

<strong>EPHE</strong> Banque de Monographies SVT 26


Muscle-specific alternative splicing of myotubularin-related 1 gene is impaired in DM1<br />

muscle cells. Hum Mol Genet 2002; 11:2297-2307.<br />

18. Groenen PJ, Wansink DG, Coerwinkel M, van den Broek W, Jansen G, Wieringa B:<br />

Constitutive and regulated modes of splicing produce six major myotonic dystrophy<br />

protein kinase (DMPK) isoforms with distinct properties. Hum Mol Genet 2000; 9:605-<br />

616.<br />

19. Charlet BN, Savkur RS, Singh G, Philips AV, Grice EA, Cooper TA: Loss of the musclespecific<br />

chloride channel in type 1 myotonic dystrophy due to misregulated alternative<br />

splicing. Mol Cell 2002; 10:45-53.<br />

20. Salminen M, Spitz F, Fiszman MY, Demignon J, Kahn A, Daegelen D, Maire P: Myotubespecific<br />

activity of the human aldolase A M-promoter requires an overlapping binding<br />

site for NF1 and MEF2 factors in addition to a binding site (M1) for unknown proteins. J<br />

Mol Biol 1995; 253:17-31.<br />

21. Salminen M, Lopez S, Maire P, Kahn A, Daegelen D: Fast-muscle-specific DNA-protein<br />

interactions occurring in vivo at the human aldolase A M promoter are necessary for<br />

correct promoter activity in transgenic mice. Mol Cell Biol 1996; 16:76-85.<br />

22. Flaherty SM, Fortes P, Izaurralde E, Mattaj IW, Gilmartin GM: Participation of the nuclear<br />

cap binding complex in pre-mRNA 3' processing. Proc Natl Acad Sci U S A 1997;<br />

94:11893-11898.<br />

23. Vagner S, Vagner C, Mattaj IW: The carboxyl terminus of vertebrate poly(A) polymerase<br />

interacts with U2AF 65 to couple 3'-end processing and splicing. Genes Dev 2000; 14:403-<br />

413.<br />

24. Zhao J, Hyman L, Moore C: Formation of mRNA 3' ends in eukaryotes: mechanism,<br />

regulation, and interrelationships with other steps in mRNA synthesis. Microbiol Mol Biol<br />

Rev 1999; 63:405-445.<br />

25. Takagaki Y, Seipelt RL, Peterson ML, Manley JL: The polyadenylation factor CstF-64<br />

regulates alternative processing of IgM heavy chain pre-mRNA during B cell<br />

differentiation. Cell 1996; 87:941-952.<br />

26. Dreyfuss G, Hentze M, Lamond AI: From transcript to protein. Cell 1996; 85:963-972.<br />

27. Pallier C: Les régions non traduites des ARN messagers et leur rôle dans la synthèse<br />

protéique. Medecine et Sciences 2001; 17:23-32.<br />

28. Meijer HA, Thomas AA: Control of eukaryotic protein synthesis by upstream open<br />

reading frames in the 5'-untranslated region of an mRNA. Biochem J 2002; 367:1-11.<br />

29. Cornelis S, Bruynooghe Y, Denecker G, Van Huffel S, Tinton S, Beyaert R: Identification<br />

and characterization of a novel cell cycle-regulated internal ribosome entry site. Mol Cell<br />

2000; 5:597-605.<br />

30. Kozak M: Initiation of translation in prokaryotes and eukaryotes. Gene 1999; 234:187-<br />

208.<br />

31. Morris DR, Geballe AP: Upstream open reading frames as regulators of mRNA<br />

translation. Mol Cell Biol 2000; 20:8635-8642.<br />

<strong>EPHE</strong> Banque de Monographies SVT 27


32. Zhang T, Kruys V, Huez G, Gueydan C: AU-rich element-mediated translational control:<br />

complexity and multiple activities of trans-activating factors. Biochem Soc Trans 2002;<br />

30:952-958.<br />

<strong>EPHE</strong> Banque de Monographies SVT 28

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!