Sabine Caussanel - EPHE
Sabine Caussanel - EPHE
Sabine Caussanel - EPHE
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
MINISTERE DE LA JEUNESSE, DE L’EDUCATION NATIONALE<br />
ET DE LA RECHERCHE<br />
ECOLE PRATIQUE DES HAUTES ETUDES<br />
Sciences de la Vie et de la Terre<br />
MEMOIRE<br />
présenté<br />
par<br />
CAUSSANEL <strong>Sabine</strong><br />
Pour l’obtention du diplôme de l’Ecole Pratique des Hautes Etudes<br />
CONTRIBUTION A L’ETUDE DU ROLE DE CKIP-1 DANS LA DIFFERENCIATION<br />
MUSCULAIRE REGULEE PAR PI3-K – IDENTIFICATION DES ARN MESSAGERS<br />
CORRESPONDANT AUX FORMES DE LA PROTEINE CKIP-1<br />
soutenu le 17 Novembre 2003 devant le jury suivant :<br />
EXBRAYAT Jean-Marie - Président<br />
VAYSSIERE Jean-Luc – Examinateur<br />
GOILLOT Evelyne – Examinateur<br />
DE KERCHOVE Alban - Examinateur<br />
Laboratoire de : Directeur : MIGNOTTE Bernard<br />
Génétique Moléculaire et Physiologique- CNRS UPRES- A8087 – Université Versailles/Saint-<br />
Quentin - mignotte@génétique.uvsq.fr<br />
Laboratoire de : Directeur : BRUN Gilbert<br />
Biologie des Régulations Cellulaires – UMR 5161 CNRS- Ecole Normale Supérieure de Lyon -<br />
egoillot@ens-lyon.fr<br />
CAUSSANEL <strong>Sabine</strong> – 17 Novembre 2003 – Pr.MIGNOTTE Bernard<br />
CONTRIBUTION À L’ÉTUDE DU RÔLE DE CKIP-1 DANS LA DIFFERENCIATION MUSCULAIRE<br />
RÉGULÉE PAR PI3-K - IDENTIFICATION DES ARN MESSAGERS CORRESPONDANT AUX DEUX<br />
FORMES DE LA PROTÉINE CKIP-1<br />
<strong>EPHE</strong> Banque de Monographies SVT 1
Au cours de l’étude du rôle de CKIP-1 dans la différenciation musculaire régulée par PI3-K dans la lignée de myoblastes<br />
C2C12, nous avons mis en évidence une nouvelle forme de la protéine CKIP-1. Cette forme a un poids moléculaire de 28kDa<br />
tandis que la protéine entière CKIP-1 a un poids moléculaire de 55kDa. Nous avons réalisé différents mutants de CKIP-1 et<br />
observé que cette forme courte semble correspondre à une protéine CKIP-1 initiée au niveau du deuxième ATG et par<br />
conséquent dépourvue de son domaine pleckstrine. Ce domaine est essentiel à la stimulation de la myogenèse par CKIP-1.<br />
Nous avons caractérisé les ARNm correspondant à ces deux formes en utilisant deux approches expérimentales différentes : la<br />
technique des ARN circulaires et la protection à la RNAse. Nous avons identifié trois populations de transcrits différents<br />
ayant des sites multiples d’initiation de la transcription. Deux d’entre elles ont des sites d’initiation de la transcription situés<br />
en aval du premier codon ATG initiateur.de la traduction et sont donc susceptibles de donner naissance à la forme courte de<br />
CKIP-1 initiée au deuxième ATG. L’analyse de la représentation de ces différentes populations de transcits suggère une<br />
représentation égale des deux protéines dans les cellules C2C12. Ceci a été confirmé en western blot. Ces résultats nous ont<br />
permis de déterminer deux régions pouvant jouer le rôle de régions promotrices. L’analyse de la séquence de ces régions a<br />
révélé des régions riches en GC pouvant correspondre à des régions promotrices de type GC riche dépourvue de boîtes<br />
d’initiation de la transcription comme la boîte TATA ou la boîte CAAT. De plus, cette région possède de nombreux sites Sp-1<br />
qui sont connus pour guider l’initiation de la transcription de gènes ayant des promoteurs dépourvus de boite TATA. En<br />
accord avec nos résultats, ce type de régions promotrices est fréquemment associé à de multiples sites d’initiation.<br />
Mot-Clefs : muscle, différenciation, CKIP-1, promoteurs, ARN messager, protéines.<br />
SOMMAIRE<br />
SOMMAIRE.... …………………………………………………………………………………...3<br />
LISTE DES ABRÉVIATIONS.... ………………………………………………………………...5<br />
INTRODUCTION... ………………………………………………………………………………7<br />
I- Régulation de la Transcription ……………………………………………………………...8<br />
1- Structure d’un gène……........ …………………………………………………………………..8<br />
2- Eléments régulateurs de la transcription dans le promoteur minimal………....... ……………...9<br />
2-1- Promoteur avec boîte TATA (ou boîte Goldberg-Hogness) …………………...... ….9<br />
2-1-1- Mise en place du complexe de pré-initiation de la transcription..... ……….9<br />
2-1-2- Les différentes boîtes pouvant être associée à la boîte TATA .. …………10<br />
2-1-3- Autres éléments initiateurs de la transcription pouvant être associés<br />
à la boîte TATA.. ………………………………………………………………..11<br />
2-1-4- Conclusion …….... ……………………………………………………….12<br />
2-2- Promoteur dépourvu de boîte TATA.... ……………………………………………12<br />
2-2-1- Boîte GC ……….…………………………………………………………12<br />
2-2-2- Rôle de l’Inr en absence de boîte TATA …….…………………………...13<br />
2-2-3- L’élément DPE (Downstream Promoter Element) …….…………………14<br />
2-2-4- L’élément BRE (IIB Recognition Element) ……….……………………..14<br />
2-2-5- Conclusion …………………………………………………………….….15<br />
3- Eléments régulateurs de la transcription dans le promoteur distal…….... ……………………15<br />
II- Maturation des ARN pré-messagers………………………………………………………16<br />
1- La coiffe……………………………………………………………………………………..............<br />
16<br />
<strong>EPHE</strong> Banque de Monographies SVT 2
2- La queue polyA……………………………………………………………………….... …….17<br />
3- L’excision-épissage des introns……………………………………………….... …………….17<br />
3-1- mécanisme d’excision-épissage constitutif………...... ………………………………….17<br />
3-2- mécanisme d’épissage alternatif………………………………………………..... ……..18<br />
3-3- Importance de l’épissage alternatif dans la myogenèse………………....... ……………..19<br />
3-3-1- Le facteur de trancription MEF2 et l’intégrine b1………....... ……………19<br />
3-3-2- Anomalie de l’épissage et pathologie musculaire……………………....…21<br />
3-3-2-1- Le gène MTMR1 (myotubularin-related 1) ……………….……21<br />
3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)..... .22<br />
4- Promoteurs alternatifs…….... ………………………………………………………………...23<br />
Utilisation du promoteur spécifique du muscle (pM) de l’Aldolase A………....... ……….23<br />
III- Régions Régulatrices de l’ARN messager …….………………………………………...24<br />
1- Interactions entre la coiffe, la séquence codante et la queue polyA…………………..... …….24<br />
2- Régulation par la coiffe et la queue polyA………..... ………………………………………...26<br />
3- Régulations par la région 5’UTR…..... ………………………………………………………..26<br />
3-1- IRES (Internal Ribosomal Entry Site)...... ………………………………………………27<br />
3-2- uORF (upstream Open Reading Frame)...... ……………………………………………28<br />
3-3- Présence de Structures Secondaires…...... ………………………………………………30<br />
4- Régulations par la région 3’UTR…..... ………………………………………………………..30<br />
4-1- CPE (Cytoplasmic Polyadenylation Element).... ……………………………………...31<br />
4-2- ARE (AU Rich Element).... ……………………………………………………………31<br />
4-3- Présence de Structures Secondaires...... …………………………………………………32<br />
5- Conclusion ………………...... ………………………………………………………………..33<br />
LISTE DES ABREVIATIONS<br />
+1 : site d’initiation de la transcription ou site de démarrage de la transcription<br />
3’UTR : 3’ UnTranslated Region<br />
5’UTR : 5’ UnTranslated Region<br />
A : adénine<br />
ADN : Acide DésoxyriboNucléique<br />
ADNc : Acide DésoxyriboNucléique complémentaire<br />
Apaf-1 : Apoptosis protease activating factor-1<br />
ARE : AU Rich Element<br />
ARN : Acide RiboNucléique<br />
ARNr : Acide RiboNucléique ribosomal<br />
ARNm : Acide RiboNucléique messager<br />
ARNt : Acide RiboNucléique de transfert<br />
ATG : codon d’initiation de la traduction<br />
<strong>EPHE</strong> Banque de Monographies SVT 3
AUF1 : AU Factor 1<br />
BRE : IIB Recognition Element<br />
C : Cytosine<br />
CBC : Cap Binding Complex<br />
CBP : Cap Binding Protein<br />
CF : Cleavage Factor<br />
CGRP : Calcitonin Gene Related Peptide<br />
CIC-1 : chloride channel-1<br />
CPE : Cytoplasmic Polyadenylation Element<br />
CPEB : CPE Binding protein<br />
CPSF : Cleavage Polyadenylation Specificity Factor<br />
CstF : Cleavage stimulating Factor<br />
CTF: CCAAT binding Transcription Factor<br />
CUG-BP: CUG-Binding Protein<br />
DM : Dystrophie Myotonique<br />
DPE : Downstream Promoter Element<br />
eIF4-(F, E, A, G) : eukaryotic translation Initiation Factor 4-(F, E, A, G)<br />
G : Guanine<br />
GMP : Guanosine Mono-Phosphate<br />
IGF : Insulin Growth Factor<br />
IGFBP-2 : Insulin-like Growth Factor-Binding Protein-2<br />
IgM : Immunoglobuline M<br />
IR : Insulin Receptor<br />
IRE : Iron Responsive Element<br />
IRES : Internal Ribosomal Entry Site<br />
IRP (1 ou 2) : Iron Responsive Protein (1 ou 2)<br />
MCK : Créatine Kinase Musculaire<br />
MEF2 : Myocyte-specific Enhancer-binding Factor 2<br />
MRF : Myogenic Regulatory Factor<br />
MSE : Muscle-specific Splicing Enhancers<br />
MTMR1 : myotubularin-related 1<br />
NLS : Nuclear Import Signal<br />
PABP (I ou II): PolyA Binding Protein (I ou II)<br />
PAP : PolyA Polymérase<br />
PI3-K : PhosphatidylInositol 3-Kinase<br />
PtdIns: PhosphatidylInositol<br />
R : purine (A, G)<br />
snRNA: small nuclear RNA<br />
T : Thymidine<br />
TAFs : TBP Associated Factors<br />
<strong>EPHE</strong> Banque de Monographies SVT 4
TBP : TATA Binding Protein<br />
TFII (A, B, D, E, F, H, J) : Transcriptional Factor II (A, B, D, E, F, H, J)<br />
TfR : Transferrine<br />
U : Uridine<br />
XIAP : X-linked Inhibitor Apoptosis Protein<br />
XLMTM : Myopathie Myotubulaire liée à l’X<br />
Y : pyrimidine (C, U, T)<br />
INTRODUCTION<br />
L’étude de l’expression des gènes nécessite de connaître toutes les zones de régulations<br />
possibles au niveau des gènes et par conséquent des ARN messagers. Il est surprenant de voir qu’un<br />
organisme contenant un nombre de gène défini comporte autant de régulations au niveau moléculaire<br />
et cellulaire. En effet, si l’on prend le cas de l’Homme qui n’a, d’après le séquençage du génome, que<br />
35 000 gènes, on comprend difficilement comment on peut arriver à une complexité moléculaire aussi<br />
grande. Cependant, il a été montré au cours du temps, qu’un même gène pouvait donner naissance à<br />
différents transcrits qui eux-mêmes pouvaient être à l’origine de la synthèse de plusieurs protéines<br />
différentes en fonction des conditions physiologiques et environnementales. Ceci sous-entend que<br />
cette complexité se situe en aval des gènes c’est-à-dire au niveau des étapes de la transcription et de<br />
la traduction.<br />
Effectivement, lors de la transcription d’un même gène, on peut aboutir à plusieurs messagers ;<br />
néanmoins la complexité s’accroît encore chez les Eucaryotes puisque l’on est confronté à une étape<br />
de maturation des messagers. Ainsi chaque pré-messager peut être initié à partir de plusieurs<br />
promoteurs et/ou subir différents épissages alternatifs. Ces étapes peuvent varier en fonction du type<br />
cellulaire ou tissulaire, des conditions physiologiques ou environnementales, ce qui augmente encore<br />
la complexité moléculaire. Cette diversité se poursuit lors de l’étape de traduction. Chaque messager à<br />
la possibilité de donner naissance à plusieurs protéines. La plupart du temps, l’initiation de la<br />
traduction se fait à partir d’un codon AUG. Or, il ne faut toutefois pas exclure les initiations<br />
exceptionnelles se faisant à partir de séquences permettant l’entrée des ribosomes de manière<br />
indépendante au codon AUG comme, par exemple les IRES. Ces deux phénomènes génèrent<br />
plusieurs isoformes protéiques à partir d’un même transcrit.<br />
Toutes ces diversités vont moduler la stabilité, la localisation et l’efficacité de la traduction des<br />
messagers.<br />
En résumé, la régulation d’un gène est contrôlée au niveau de:<br />
- la chromatine par des phénomènes de méthylation.<br />
- la transcription par sa région promotrice qui lui permet de fixer des facteurs de transcription<br />
modulant son expression.<br />
- la maturation des pré-messagers par la mise en place de la coiffe et de la queue polyA ainsi que les<br />
mécanismes d’épissage alternatif.<br />
- les initiations variables de la traduction<br />
- les différentes régulations des régions UTR (5’et 3’ UnTranslated Region)<br />
- les étapes post-traductionnelles.<br />
<strong>EPHE</strong> Banque de Monographies SVT 5
Dans la première partie de cette introduction, nous rappellerons brièvement les différentes étapes de la<br />
régulation de la transcription en utilisant des exemples précis concernant des gènes impliqués dans le<br />
développement et la pathologie du tissu musculaire. Lors de notre étude du gène CKIP-1, nous avons<br />
été confrontés à certains de ces processus de régulation de l’expression d’un gène. Ces résultats<br />
seront présentés et discutés après une présentation des mécanismes moléculaires de la différenciation<br />
musculaire dans lesquels CKIP-1 est impliqué.<br />
I – Régulation de la Transcription<br />
La transcription aboutit à la synthèse de l’ARN messager (ARNm) à partir du brin négatif de la<br />
molécule d’ADN. Cette étape a lieu dans le noyau des cellules eucaryotes.<br />
1- Structure d’un gène<br />
Un gène est généralement composé de quatre parties bien distinctes :<br />
- La première partie correspond au promoteur.<br />
Ce promoteur est composé d’un promoteur proximal (ou minimal) et d’un promoteur distal. Le<br />
promoteur proximal correspond à l’ensemble des éléments régulateurs permettant la fixation indirecte<br />
de l’ARN polymérase II. Les éléments régulateurs sont situés en amont du site d’initiation de la<br />
transcription et sont indispensables à sa reconnaissance. Le promoteur distal, quant à lui, possède des<br />
séquences reconnues par différents facteurs de transcription qui agiront comme des trans-activateurs<br />
ou des trans-répresseurs selon les signaux reçus par la cellule.<br />
- La seconde partie correspond à la région 5’ UTR.<br />
Elle est bornée par le site d’initiation de la transcription (+1) et le codon d’initiation de la traduction<br />
(ATG).<br />
- La troisième partie correspond à une séquence codante discontinue. Cette séquence<br />
contient des exons qui possèdent l’information génétique et codent pour la protéine ainsi que des<br />
introns qui s’intercalent entre les différents exons. Ces séquences seront transcrites mais pas traduites.<br />
Elles peuvent posséder des éléments régulateurs de la transcription (enhancers ou silencers).<br />
- La dernière partie du gène correspond à une région 3’ transcrite mais non traduite<br />
(3’UTR) qui se situe en aval de la séquence codante précédemment décrite. Cette partie contient la<br />
séquence génomique 5’AATAAA3’ appelée signal de polyadénylation qui sera interpretée par l’ARN<br />
polymérase comme un signal de fin de la transcription<br />
2- Eléments régulateurs de la transcription dans le promoteur minimal<br />
<strong>EPHE</strong> Banque de Monographies SVT 6
Parmi les plus fréquemment utilisés, on retrouve la boîte TATA présente dans la majorité des gènes.<br />
Cependant, certains promoteurs contiennent d’autres éléments permettant l’initiation de la<br />
transcription comme la boîte TATA : l’Inr, le DPE et le BRE. Dans certains promoteurs, aucun de ces<br />
sites remarquables n’est retrouvé.<br />
2-1- Promoteurs avec boîte TATA (ou boîte Goldberg-Hogness)<br />
La séquence de la boîte TATA est riche en A et T et son motif consensus est : 5’TATAAA3’. Cette<br />
boîte TATA est située à –30 nucléotides en amont du site d’initiation de la transcription. Ce motif<br />
TATA permet la fixation de l’ARN polymérase II sur l’ADN par l’intermédiaire de la protéine TBP<br />
(TATA Binding protein). Cette protéine appartient avec les TAFs (TBP Associated Factors) au<br />
complexe multiprotéique de pré-initiation de la transcription TFIID.<br />
2-1-1- Mise en place du complexe de pré-initiation de la transcription<br />
Lors de l’initiation de la transcription, le complexe multiprotéique TFIID (Transcriptional Factor II D)<br />
se fixe par l’intermédiaire de la protéine TBP (TATA-binding protein) sur la boîte TATA, constituée<br />
d’une séquence riche en T et A et située 30 nucléotides en amont du premier nucléotide qui sera<br />
transcrit. La fixation de ce complexe multiprotéique permet la reconnaissance du site de démarrage de<br />
la transcription par l’ARN polymérase II. Le complexe I, constitué de TFIID sur la boîte TATA,<br />
s’associe à TFIIB et génère le complexe II. L’addition de TFIIF à ce complexe permet l’entrée de<br />
l’ARN polymérase II en aval de la région TATA et permet la formation du complexe III. Ce nouveau<br />
complexe ainsi formé va permettre l’association de TFIIE et TFIIH pour faire le complexe V. Ces<br />
derniers auraient pour rôle de dénaturer la double hélice d’ADN au site d’initiation de la transcription<br />
grâce à leur activité hélicase. Cependant, des études récentes ont montré que l’entrée de TFIIH dans<br />
le cycle de transcription dépend de l’association du complexe III avec TFIIE et donc implique la<br />
présence d’un complexe intermédiaire (complexe IV) [1]. Ces études nous permettent juste de dire<br />
qu’une coopération entre TFIIE, TFIIH et le complexe de pré-initiation (complexe III) est<br />
indispensable pour former le complexe V. Ce dernier quand il est associé à TFIIJ forme le complexe<br />
VI. TFIIA, quant à lui, semble pouvoir s’associer avec tous les complexes intermédiaires de préinitiation.<br />
Des études ont montré que seule la présence du complexe I est nécessaire à l’association de<br />
TFIIA. TFIIA se lie donc de manière dépendante à TFIID en amont de la région TATA. Son effet<br />
semble être indirect sur la transcription et son rôle consiste probablement à induire un changement de<br />
conformation d’un état inactif de TFIID à un état actif.<br />
2-1-2- Les différentes boîtes pouvant être associées à la boîte TATA<br />
La boîte CCAAT se trouve en amont de la boîte TATA, entre la position –120 et la position -80<br />
nucléotides du site de démarrage de la transcription. La modification de cette boîte a permis de<br />
montrer qu’elle est indispensable pour accentuer la vitesse de transcription des gènes la contenant.<br />
<strong>EPHE</strong> Banque de Monographies SVT 7
Cette boîte peut se trouver sur le brin sens comme sur le brin antisens. Dans ce dernier cas, elle est<br />
alors sous sa forme complémentaire sur le brin sens, c’est-à-dire : 5’ATTGG3’. Sa séquence permet<br />
d’interagir avec un facteur trans-régulateur appelé CTF (CCAAT binding Transcription Factor) isolé<br />
de cellules de mammifères.<br />
La boîte GC est formée d’éléments riches en bases G et C. Si elle est présente, elle est localisée en<br />
principe entre la boîte TATA et la boîte CCAAT. Le motif riche en GC est généralement unique en<br />
présence d’une boîte TATA. Sa séquence permet la fixation du facteur de transcription Sp-1.<br />
Cependant la protéine Sp-1 ne se lie pas forcément de manière égale à toutes les boîtes GC [2]. En<br />
effet, ces séquences seraient sensibles à la méthylation au niveau de leur cytosine.<br />
2-1-3- Autres éléments initiateurs de la transcription pouvant être associés à la<br />
boîte TATA<br />
Certains promoteurs ayant une boîte TATA peuvent également posséder d’autres éléments initiateurs<br />
de la transcription<br />
L’élément initiateur Inr correspond à un motif qui chevauche le site d’initiation de la transcription<br />
et dont la séquence consensus est la suivante :<br />
5’YYA N(T/A)YY3’ chez les mammifères.<br />
+1<br />
N = nucléotides<br />
Y = pyrimidine<br />
Des études ont montré que l’Inr semble ne pas être important ni pour la localisation du site de<br />
démarrage de la transcription ni pour la direction de la transcription. Deux hypothèses ont été<br />
avancées. Dans la première, si l’affinité de liaison ADN-protéines est forte, l’Inr pourrait augmenter<br />
l’intensité du promoteur dans le cas d’une boîte TATA bien localisée et jouer le rôle d’activateur.<br />
Dans la seconde hypothèse, l’Inr serait reconnu comme un simple élément de la machinerie<br />
transcriptionnelle. Ainsi comme la boîte TATA facilite un haut niveau de transcription, l’Inr en aval<br />
de cette dernière conduirait à un très fort niveau basal de transcription [3]<br />
L’élément BRE (IIB Recognition Element)<br />
La séquence consensus du BRE est 5’(G/C)(G/C)(G/A)CGCC3’. Elle est immédiatement suivie du<br />
5’T de la séquence consensus 5’TATAA3’ constituant la boîte TATA [4]. Elle est reconnue par le<br />
facteur de transcription TFIIB par son motif hélice-boucle-hélice de liaison à l’ADN. Plus la<br />
séquence consensus est conservée in vitro, plus le facteur TFIIB se fixe à celle-ci pour permettre<br />
l’assemblage du complexe de pré-initiation et donc l’initiation de la transcription. Des études ont<br />
<strong>EPHE</strong> Banque de Monographies SVT 8
montré que l’interaction TFIIB-BRE pourrait jouer un rôle dans :<br />
- la détermination de l’activité globale transcriptionnelle du promoteur,<br />
- l’ordre d’assemblage du complexe de pré-initiation à un promoteur,<br />
- l’étape limitante dans l’initiation de la transcription d’un promoteur,<br />
- la sensibilité d’un promoteur envers des activateurs transcriptionnels<br />
spécifiques.<br />
BRE semble également être capable de déterminer la direction amont/aval de l’assemblage du<br />
complexe de pré-initiation ainsi que de l’initiation de la transcription en présence de l’interaction<br />
TBP-boîte TATA.<br />
2-1-4- Conclusion<br />
En conclusion, l’initiation de la transcription pour un promoteur avec une boîte TATA peut se faire<br />
par :<br />
(1) la boîte TATA seule, localisée en position –30 par rapport au site de démarrage de la transcription<br />
et reconnue par la TBP.<br />
(2) la boîte TATA en combinaison avec d’autres éléments :<br />
- l’élément initiateur Inr, localisé près de la position –1.<br />
- l’élément BRE (IIB Recognition Element), localisé en position –7 de la boîte TATA et reconnu par<br />
TFIIB.<br />
Toutefois, on ne peut pas écarter la possibilité que des séquences régulatrices présentes dans les<br />
promoteurs distaux puissent réguler spécifiquement la transcription par interaction avec la boîte<br />
TATA ou les éléments Inr ou BRE présents dans le promoteur proximal.<br />
2-2- Promoteur dépourvu de boîte TATA<br />
La boîte TATA n’est pas indispensable car la majorité des gènes constitutifs ou domestiques<br />
(housekeeping genes) n’en possèdent pas. Des études ont montré que des délétions ou des mutations<br />
de la boîte TATA n’abolissent pas totalement la transcription. Les deux effets observés sont : une<br />
diminution du taux de transcription et une perte de la fidélité du site d’initiation.<br />
2-2-1- La boîte GC<br />
En l’absence de boîte TATA, la séquence de type 5’GGGCGG3’, située de manière variable, et<br />
connue sous le nom de boîte GC semble pouvoir la remplacer. Le motif riche en GC est généralement<br />
répété plusieurs fois. Le facteur trans-régulateur le plus connu pour se fixer dessus est la protéine Sp-<br />
1. Ce facteur de transcription est un activateur ubiquitaire. Il est requis pour l’expression constitutive<br />
et inductible d’un grand nombre de gènes. Les études qui ont permis de mettre en évidence le rôle de<br />
Sp-1 ont été réalisé dans le virus SV40. Les auteurs ont montré que Sp1 lie sélectivement une<br />
<strong>EPHE</strong> Banque de Monographies SVT 9
séquence riche en GC, présente en 6 répétitions d’hexanucléotides dans le promoteur proximal du<br />
virus SV40 [5].<br />
Depuis, d’autres études ont montré qu’une grande variété de promoteurs cellulaires et viraux<br />
contenaient des boîtes GC et qu’elles pouvaient être activées par Sp-1 in vitro. Ces boîtes GC sont<br />
souvent retrouvées près de sites de liaisons à d’autres facteurs de transcription, suggérant que ces<br />
facteurs pourraient agir en coopération pour moduler la transcription. C’est le cas du promoteur à<br />
l’IGFBP-2 (Insulin-like Growth Factor-Binding Protein-2) [2] du rat qui tout en étant dépourvu de<br />
boîte TATA ainsi que de boîte CCAAT, possède cependant une région riche en GC dans sa partie<br />
proximale. Cette région contient quatre boîtes GC, dont trois sont très proches les unes des autres.<br />
Elles peuvent être toutes des sites potentiels de fixation du facteur de transcription Sp-1. Une étude a<br />
démontré que la fixation de Sp-1 aux trois plus proches boîtes GC était essentielle pour l’activité<br />
promotrice. Cependant, la fixation de facteurs de transcription à leur site consensus situés en amont<br />
est nécessaire pour l’expression du gène. Bien que des études aient démontré que Sp-1 est nécessaire<br />
pour atteindre un niveau basal de la machinerie transcriptionnelle et qu’il semble indispensable pour<br />
obtenir une activité maximale des promoteurs chez les mammifères, on ignore toujours si cette<br />
transcription est activement régulée dans les cellules de mammifères ou si elle est simplement<br />
influencée par la quantité de protéine Sp-1 contenue dans le noyau [6, 7].<br />
2-2-2- Rôle de l’Inr en absence de boîte TATA<br />
L’élément initiateur, Inr, en absence de boîte TATA, aurait pour rôle de guider l’ARN polymérase II<br />
vers un site de démarrage de la transcription et peut donc permettre l’initiation de la transcription à<br />
partir d’un site unique.<br />
L’Inr pourrait également influencer la direction de la transcription en absence de boîte TATA [3].<br />
L’initiation de la transcription par l’intermédiaire d’une séquence Inr fait intervenir le facteur TFIID<br />
[8].<br />
Les promoteurs dépourvus de boîte TATA n’ont pas tous un élément initiateur mais ils possèdent<br />
d’autres éléments activateurs capables de permettre l’initiation de la transcription :<br />
2-2-3- L’élément DPE (Downstream Promoter Element)<br />
Le DPE est un site de reconnaissance de TFIID fréquemment trouvé dans les promoteurs dépourvus<br />
de boîte TATA. En effet, parmi les 205 éléments régulateurs de la transcription chez Drosophila<br />
melanogaster, il a été estimé : que 29% des promoteurs contiennent une boîte TATA (sans DPE),<br />
26% contiennent un élément DPE (sans boîte TATA), 14% contiennent les motifs DPE et TATA et<br />
31% ne contiennent ni l’un ni l’autre. La séquence DPE est conservée de Drosophila melanogaster à<br />
l’Homme et semble être aussi commune que la boîte TATA.<br />
Sa séquence consensus est localisée entre la position +28 et +32: 5’(A/G)G(A/T)(C/T)(G/A/C)3’ [5].<br />
Par rapport au site d’initiation de la transcription. Des études ont montré une coopération entre les<br />
<strong>EPHE</strong> Banque de Monographies SVT 10
motifs Inr et DPE. Ainsi, une mutation dans le motif Inr ou dans le motif DPE entraîne une forte<br />
diminution de l’activité du promoteur. Il en est de même dans le cas d’une insertion ou d’une délétion<br />
de nucléotides dans ces deux motifs. Ces observations indiquent que la transcription basale<br />
dépendante de DPE implique une liaison coopérative de TFIID (et plus précisément de certaines<br />
TAFs) avec les motifs DPE et Inr [9]. De plus, il a été montré que si l’on inactive le motif TATA<br />
d’un promoteur, son activité transcriptionnelle est totalement restaurée si l’on ajoute à ce dernier la<br />
séquence DPE dans sa position originelle (à +28 nucléotides du site de démarrage de la transcription)<br />
[10].<br />
2-2-4- L’élément BRE (IIB Recognition Element)<br />
Le motif BRE, quant à lui, joue un rôle important en absence de boîte TATA car il interagit avec<br />
TFIIB. En effet, des études ont montré que cette interaction pourrait avoir un rôle dominant dans<br />
l’assemblage du complexe de pré-initiation de la transcription mais aussi dans l’initiation de la<br />
transcription d’un promoteur dépourvu de boîte TATA. De plus, lors d’une recherche dans des bases<br />
de données de promoteurs eucaryotes, le motif BRE apparaît à une fréquence significative dans des<br />
promoteurs sans boîte TATA [4].<br />
2-2-5- Conclusion<br />
En conclusion, l’initiation de la transcription pour un promoteur dépourvu de boîte TATA peut se<br />
faire par :<br />
- la ou les boîtes GC reconnue(s) par le facteur de transcription ubiquitaire Sp-1.<br />
- l’élément initiateur Inr combiné ou non avec l’élément DPE.<br />
- l’élément BRE, localisé en position –37<br />
Tous les promoteurs n’étant pas isolés, il est difficile d’estimer la représentation des différents motifs<br />
dans les promoteurs proximaux. Cependant, il est maintenant clairement établi que le promoteur<br />
proximal ne dirige pas seulement le démarrage de la transcription. Il joue également un rôle crucial<br />
dans la régulation de la transcription en collaboration avec le promoteur distal.<br />
3- Eléments régulateurs de la transcription dans le promoteur distal<br />
Le promoteur distal présente des séquences régulatrices spécifiques de chaque gène. Ces motifs<br />
spécifiques sont reconnus spécifiquement par des facteurs de transcription. Ces facteurs recrutent, par<br />
des interactions protéines-protéines avec d’autres facteurs de transcription et/ou des co-facteurs, la<br />
machinerie basale de la transcription et ainsi régulent la transcription<br />
Les séquences cis-régulatrices du gène qui permettent la fixation de facteur trans-régulateurs ont des<br />
effets sur la vitesse de la transcription. En effet, le taux de transcription du gène peut être<br />
<strong>EPHE</strong> Banque de Monographies SVT 11
usquement modifié positivement si l’on est en présence d’une séquence activatrice (enhancer) ou<br />
négativement si l’on est en présence d’une séquence inhibitrice (silencer). Ce mécanisme régulateur<br />
dépend le plus souvent de circonstances physiologiques. Il permet d’ajuster le taux de transcription<br />
aux besoins cellulaires.<br />
Les cellules répondent donc à des signaux (intra et extra-cellulaires) en activant ou réprimant certains<br />
gènes, ainsi qu’en modulant l’importance de la transcription des gènes actifs. La transcription d’un<br />
gène est donc régulée par les facteurs de transcription qui se fixent aussi bien sur le promoteur<br />
proximal que sur le promoteur distal. Cette régulation aboutit à la synthèse d’un ARN pré-messager.<br />
En effet, chez les eucaryotes, l’ARN subit une maturation post-transcriptionnnelle au niveau du noyau<br />
avant d’être traduit en protéine dans le cytoplasme.<br />
II- Maturation des ARN pré-messagers<br />
L’ARN messager chez les eucaryotes va subir de nombreuses modifications post-transcriptionnnelles.<br />
Les exons comme les introns sont transcrits pour donner une longue molécule d’ARN appelée<br />
transcrit primaire ou précurseur de l’ARNm (pré-ARNm). L’ARNm va se voir rajouté une coiffe dans<br />
sa région 5’, une série d’adénosines dans sa région 3’ et va subir un mécanisme d’excision-épissage.<br />
Ces modifications se font dans le noyau. Elles se déroulent au cours de l’étape de transcription et<br />
aboutissent à la maturation de l’ARNm. Elles sont dépendantes les unes des autres, comme nous le<br />
verrons dans le paragraphe III-1.<br />
1- La coiffe<br />
La mise en place de la coiffe ou ²capping² est la première étape de maturation du messager.<br />
La coiffe ou ²cap² est un 7-methyl-guanosine c’est-à-dire un GMP (Guanosine Mono-Phosphate)<br />
ayant un groupement méthyl sur l’atome d’azote en position 7.<br />
Elle se met en place dès le début de la transcription, avant que 30 nucléotides ne soient assemblés.<br />
Elle est reliée au premier nucléotide du transcrit primaire par une liaison phosphoanhydre. En effet, le<br />
groupement tri-phosphate du premier nucléotide est hydrolysé en di-phosphate par une ARN 5’ triphosphatase.<br />
Une guanylyltransférase catalyse la liaison GMP avec le premier nucléotide diphosphate,<br />
créant une liaison 5’-5’ triphosphate. Une méthyltransférase méthyle ensuite l’atome<br />
d’azote en position 7 du GMP.<br />
D’autres modifications peuvent également se produire, telle une méthylation de l’OH en 2’ des<br />
riboses situés sur les deux premiers nucléotides de l’extrémité 5’ du transcrit primaire. L’ARNm<br />
n’aura donc plus une extrémité 5’ phosphate libre. La coiffe protègerait ainsi l’extrémité 5’ des<br />
ARNm de l’attaque par des enzymes (phosphatases, nucléases). La coiffe joue également un rôle<br />
important dans la reconnaissance des ARN. Enfin, elle est nécessaire pour la liaison de la petite sousunité<br />
du ribosome qui assurera par la suite le processus de traduction.<br />
<strong>EPHE</strong> Banque de Monographies SVT 12
2- La queue polyA<br />
La polyadénylation s’effectue immédiatement après que le messager a été transcrit.<br />
En effet, une fois synthétisés, les ARN messagers sont clivés dans leur partie 3’ une vingtaine de<br />
bases en aval de la séquence AAUAAA. Cette séquence est reconnue par la protéine de clivage CPSF<br />
(Cleavage Polyadenylation Specificity Factor) et est suivie d’une seconde séquence riche en GU ou en<br />
U reconnue par une autre protéine de clivage CstF (Cleavage stimulating Factor). Ces facteurs, en<br />
association avec les protéines de clivages CFI et CFII (Cleavage Factor I and II) et la polyA<br />
polymérase (PAP), clivent l’ARN pré-messager et permettent l’addition d’environ 250 adénosines<br />
consécutives. Par la suite une protéine de 70kDa, la PABPII (PolyA Binding Protein II) se fixe sur la<br />
queue polyA. La queue polyA (associée à la PABP) semble jouer un rôle dans la stabilisation des<br />
messagers et dans l’initiation de la traduction [11, 12].<br />
3- L’excision-épissage des introns<br />
Elle consiste en l’élimination de toutes les séquences introniques du transcrit primaire. Ce mécanisme<br />
est commun à la grande majorité des ARN messagers. Le premier élément dans la connaissance des<br />
mécanismes de l’épissage fut la mise en évidence de séquences dinucléotidiques, appelées séquences<br />
consensus retrouvées aux extrémités des introns. Ces dinucléotides sont GU en 5’ et AG en 3’ de<br />
l’intron (règle de Breathnatch.R et Chambon.P). Des expériences de mutagenèse ont confirmé<br />
l’importance de ces séquences. De plus, des expériences d’épissage in vitro ont permis de montrer<br />
que l’intron formait une structure en lasso au cours de l’épissage.<br />
3-1- Mécanisme d’excision-épissage constitutif<br />
Les éléments qui jouent un rôle important lors de l’excision-épissage du transcrit primaire sont [12] :<br />
- La région 5’ de la jonction exon-intron qui possède la séquence consensus : AG/GURAGU<br />
(R= purines). La séquence dinucléotidique GU de l’intron est appelé site donneur d’épissage.<br />
- La région 3’ de la jonction intron-exon contenant un motif YAG/RNNN. La séquence AG se trouve<br />
dans l’intron et est appelé site accepteur d’épissage.<br />
- Le site de branchement du lasso qui est : CURA20HY. Il se trouve à peu près à 100 nucléotides en<br />
amont du site accepteur d’épissage. Dans ce motif, le nucléotide adénosine (A) suivi des<br />
pyrimidines (Y) est très conservé.Le mécanisme d’épissage peut être décomposé en 2 étapes de<br />
trans-estérification et nécessite aussi la présence de petits ARN de type snRNA (small nuclear<br />
RNA). Ces petits ARN agissent sous forme de complexes avec des protéines et sont alors<br />
nommés : snRNP (small nuclear RiboNucleoprotein Particles). Plusieurs types de snRNP existent,<br />
ils diffèrent par leur structure mais ils sont tous riches en uracile: U1, U2, U3, U4, U5, U6. Dans<br />
un premier temps, l’ARN U1 s’hybride au niveau du site donneur de l’ARN messager par<br />
<strong>EPHE</strong> Banque de Monographies SVT 13
homologie de séquence et en présence du facteur d’épissage de la famille des phosphoprotéines<br />
SR (Sérine Arginine): SF2. Cette fixation permet :- l’initiation de l’assemblage du "spliceosome"<br />
au niveau de l’intron à éliminer - la coupure en 5’ du G de la séquence consensus GU. L’ARN U2<br />
se fixe ensuite au niveau du site de branchement ; cette fixation nécessite un autre facteur<br />
protéique : U2AF (U2 small nuclear ribonucleoprotein Auxiliary Factor). L’extrémité 5’ libérée<br />
du site donneur subit une liaison phosphodiester un peu particulière avec le 2’OH du ribose de<br />
l’adénosine du site de branchement auquel s’est fixé l’ARN U2. A cette structure sont associés U4<br />
et U6. L’ARN U5 s’est fixé au niveau du site accepteur d’épissage. La première étape consiste<br />
donc en la formation du lasso à proprement parlé.Dans un second temps, le premier exon, bien<br />
que coupé, reste associé à l’intron via des protéines. La formation du "spliceosome" fait que<br />
l’extrémité 3’OH libre de l’exon se trouve en face du site accepteur. Une seconde réaction de<br />
trans-estérification va entraîner sa ligation à l’extrémité 5’ de l’exon suivant. La seconde étape du<br />
mécanisme d’épissage a donc pour but de raccorder puis fusionner les deux exons et d’induire la<br />
libération de l’intron sous forme de lasso [12, 13].<br />
3-2- Mécanisme d’épissage alternatif<br />
L’épissage est dit alternatif lorsque les messagers résultent de l’utilisation alternative de sites<br />
accepteurs et/ou donneurs d’épissage "faibles" pouvant conduire, après traduction, à des protéines<br />
différentes. Ces sites d’épissage "faibles" (par opposition aux sites d’épissage constitutifs) sont<br />
reconnus dans certaines conditions et conduisent à l’addition ou l’exclusion d’exon(s), la rétention<br />
entière ou partielle d’intron(s) ou d’exon(s). Ce mécanisme permet d’augmenter la capacité de codage<br />
des gènes et il se rencontre en particulier dans les gènes impliqués dans la physiologie du cerveau et<br />
du muscle.<br />
3-3- Importance de l’épissage alternatif dans la myogenèse<br />
3-3-1- Le facteur de transcription MEF2 et l’intégrine b1<br />
Les gènes MRF (Myogenic Regulatory Factor) de la famille MyoD régulent le programme de<br />
différenciation du muscle squelettique. Il existe quatre facteurs régulateurs du muscle (MRF) de la<br />
famille MyoD : la myogénine, MRF4, Myf5 et MyoD lui-même. Ces facteurs de transcription ont des<br />
motifs de type hélice-boucle-hélice (helix-loop-helix) qui se lient sur une séquence spécifique de<br />
l’ADN, appelée boîte E, après hétérodimérisation. Des expériences d’inactivation par recombinaison<br />
homologue chez la souris ont montré que MyoD et Myf5 ont des rôles partiellement chevauchant<br />
dans la détermination des cellules précurseurs du muscle, alors que la myogénine apparaît être<br />
essentielle pour la différenciation de ces cellules en cellules musculaires. Si des cellules non<br />
musculaires sont transfectées avec un des MRF, elles vont soit se transformer en cellules<br />
myogéniques soit ne pas exprimer le phénotype musculaire, tout dépend du type de cellules analysées.<br />
L’étude des cellules NIH3T3 [14] montrent qu’elles subissent une transformation myogénique<br />
<strong>EPHE</strong> Banque de Monographies SVT 14
incomplète après transfection avec les différents MRF. En effet, ces cellules transfectées sortent du<br />
cycle cellulaire et expriment les marqueurs moléculaires de la différenciation mais ne rentrent pas en<br />
différenciation terminale, c’est-à-dire qu’elles ne forment pas de myotubes multinuclés.<br />
L’incapacité à fusionner des cellules NIH3T3 transfectées par un membre de la famille MyoD est<br />
principalement due à l’impossibilité de générer, par épissage différentiel, les transcrits spécifiques du<br />
muscle comme la sous-unité de l’intégrine b1D et le facteur de transcription MEF2-D (Myocytespecific<br />
Enhancer Factor 2-D).<br />
Cette sous-unité b1D de l’intégrine est localisée dans le muscle squelettique au niveau de diverses<br />
structures d’adhésion où elle est en contact direct avec la taline et l’a-actinine [15]. Elle est associée<br />
dans le muscle squelettique adulte avec les sous-unités a7A et a7B de l’intégrine. Elle est exprimée<br />
après la fusion des myoblastes et son expression continue à augmenter pendant la croissance et la<br />
maturation des myotubes, par opposition avec l’isoforme b1A dont l’expression diminue pendant la<br />
myodifférenciation pour disparaître lorsque les myotubes différenciés arrivent à maturation (après la<br />
fusion des cellules). En effet, dans les myoblastes C2C12, b1A est progressivement remplacée par<br />
b1D. Le domaine cytoplasmique de la sous-unité b1D correspond à un épissage alternatif unique de<br />
50 acides aminés. Les 24 derniers acides aminés ajoutés par cet épissage sont codés par un nouvel<br />
exon du gène de l’intégrine b1. Parmi ces 24 acides aminés, 13 sont uniques et 11 sont conservés par<br />
comparaison avec l’isoforme b1A. Les deux isoformes possèdent deux motifs conservés NPXY à la<br />
même position. L’incapacité des cellules NIH3T3 surexprimant les MRF à fusionner est directement<br />
corrélée à un très faible niveau d’épissage alternatif de l’isoforme b1 D spécifique du muscle. Ces<br />
cellules présentent un épissage défectueux du gène MEF2-D.<br />
Le facteur de transcription MEF2-D appartient à la famille des Myocyte-specific Enhancer-binding<br />
Factor 2. Ce facteur de transcription se lie et active la transcription sous forme d’hétérodimères avec<br />
MEF2A et MEF2C, en reconnaissant une séquence d’ADN conservée riche en A/T :<br />
5’CTA(A/T) 4TA(G/A)3’. MEF2D lie cette séquence consensus avec une haute affinité et semble être<br />
un puissant activateur transcriptionnel. Ce facteur de transcription partage par la boîte MADS (qui<br />
permet la liaison à l’ADN et la dimérisation) et le domaine MEF2 une forte homologie d’acides<br />
aminés avec d’autres membres de la famille MEF2. L’ADNc codant MEF2D montre un cadre de<br />
lecture ouvert non interrompu de 514 acides aminés correspondant à une protéine de 55kDa.<br />
L’épissage alternatif de ce gène peut conduire à quatre transcrits : un sans les exon 1a et 1b ni l’exon<br />
2, un avec l’exon 1a, un avec l’exon 1b et un dernier avec l’exon 2. Ces différentes isoformes lient<br />
l’ADN de la même manière et ont des activités transcriptionnelles comparables dans les tissus où ils<br />
sont présents [16].<br />
Des études de son patron d’expression ont montré qu’il y avait prédominance du transcrit contenant<br />
l’exon 1b dans les myotubes C2C12 ainsi que dans le muscle squelettique. Les transcrits contenant<br />
l’exon 1a et l’exon 1b sont présents à des niveaux similaires dans le muscle cardiaque. Il a été montré<br />
que dans les cellules NIH3T3, l’épissage alternatif aboutissant à la forme MEF2D 1b spécifique du<br />
muscle est défectueux.<br />
<strong>EPHE</strong> Banque de Monographies SVT 15
En conclusion, les différentes isoformes de l’intégrine b1 et/ou du facteur de transcription MEF2 sont<br />
tissu-spécifiques et l’incapacité à générer les formes musculaires des ARNm de ces deux gènes dans<br />
les cellules NIH3T3 ne permet donc pas l’obtention du ²phénotype musculaire².<br />
L’épissage alternatif est donc un mécanisme qui génère une diversité protéique importante et présente<br />
une régulation complexe. Des anomalies de ce processus peuvent conduire à des disfonctionnements<br />
importants comme nous allons le voir dans le paragraphe suivant.<br />
3-3-2- Anomalie de l’épissage et pathologie musculaire<br />
3-3-2-1- Le gène MTMR1 (myotubularin-related 1)<br />
Le gène MTMR1 appartient à une famille de lipides phosphatases. Le premier membre de cette<br />
famille de gène, MTM1 code pour la myotubularine, une phosphatase spécifique du<br />
phosphatidylinositol 3-phosphate [PI(3)P]. MTM-1 est muté dans la myopathie myotubulaire liée à<br />
l’X (XLMTM) provoquant de sérieux désordres congénitaux qui affectent le muscle squelettique.<br />
MTM1 et MTMR1 sont homologues, adjacents sur le chromosome X et codent pour des protéines<br />
présentant 59% d’identité de séquence. Six isoformes d’ARNm de MTMR1 ont été mis en évidence<br />
par différents épissages alternatifs de trois exons (2.1, 2.2, 2.3) dans l’intron 2 du gène [17]. Les six<br />
isoformes issues des différents épissages alternatifs des trois exons supplémentaires sont :<br />
- A (absence des trois exons) et B (présence de l’exon 2.1). Ils sont ubiquitaires au stade<br />
embryonnaire.<br />
- C (présence des exons 2.1 et 2.2). Il est spécifique du muscle squelettique adulte.<br />
- D (présence des exons 2.1 , 2.2 et 2.3). Il se trouve dans le muscle et le cœur au stade embryonnaire<br />
tardif.<br />
- E (présence de l’exon 2.3) et F (présence des exons 2.1 et 2.3). Ils sont spécifiques du cerveau.<br />
L’isoforme C (contenant les exons 2.1 et 2.2) est majoritaire dans le muscle squelettique adulte et<br />
induite pendant la myogenèse aussi bien in vivo qu’in vitro. Les isoformes A et C de la protéine<br />
MTMR1 ont la même spécificité de substrat (PI(3)P) et montrent la même localisation sub-cellulaire.<br />
Buj-bello et col. ont montré que l’épissage alternatif conduisant à cette forme C spécifique du muscle<br />
est altéré dans une pathologie du muscle où de nombreuses pertubations d’épissages ont été décrites :<br />
la dystrophie myotonique (DM). Ceci aboutit à une réduction de cette isoforme et à la présence d’une<br />
nouvelle isoforme G. Dans des cellules ainsi que dans des tissus fœtaux DM, ce transcrit est anormal<br />
et ne contient que l’exon 2.2. Cet ARNm n’est pas affecté dans la myopathie myotubulaire liée à l’X<br />
(XLMTM). Cependant, l’importance de ce phénomène dans la pathologie DM n’est pas encore<br />
établie. D’autres défauts d’épissage ont été décrits pour les gènes IR (Insulin Receptor) et CIC-1<br />
(chloride channel) impliqués dans cette pathologie.<br />
3-3-2-2- Les gènes IR (Insulin Receptor) et CIC-1 (chloride channel)<br />
<strong>EPHE</strong> Banque de Monographies SVT 16
Chez les patients atteints de DM1, le transcrit du gène DMPK comporte des répétitions multiples de<br />
triplet CTG dans sa partie 3’UTR [18]. Ces ARNm mutants de DMPK contiennent jusqu’à milles<br />
répétitions CTG et la sévérité de la maladie est directement corrélée à la longueur de ces extensions.<br />
L’expression de DMPK dans les cellules DM1 est très faible. Il a été montré que la faible traduction<br />
de ces transcrits n’est pas due à un épissage défectueux mais à leur rétention dans le noyau. En effet,<br />
ces transcrits mutants sont accumulés au niveau du noyau et étroitement associés à la matrice<br />
nucléaire. Cette perte de fonction de DMPK dans les cellules DM1 est donc due à un mauvais export<br />
des ARNm et par conséquent à une traduction réduite de DMPK. Cependant, ce phénomène n’est pas<br />
directement responsable de la maladie. En effet, la maladie développée par les souris dont le gène<br />
DMPK a été inactivé par recombinaison homologue n’est pas similaire à DM1. Aucune autre<br />
mutation dans le gène DMPK n’a jamais été observée chez les patients DM1. De plus, la maladie<br />
DM2, une autre forme de dystrophie myotonique, phénotypiquement très proche de DM1, est causée<br />
par des extensions CCTG dans l’intron 1 du gène ZNF9. Le transcrit de ZNF9 est également retenu<br />
dans le noyau.<br />
Il a donc été suggéré que la présence de ces répétitions CUG dans ces ARNm (ARN (CUG)n ) est<br />
responsable de ces maladies indépendamment du locus considéré [19]. La ribonucléoprotéine<br />
nucléaire (hnRNP) CUG-BP fixe l’ARN et est impliquée dans la régulation de l’épissage alternatif<br />
d’ARNm spécifiques en se fixant sur des séquences introniques conservées contenant des éléments<br />
riches en U/G. Cette protéine est surexprimée dans les cellules DM1 et DM2, c’est à dire dans les<br />
cellules contenant des (ARN (CUG)n ). Le mécanisme de régulation de son expression par ces<br />
séquences CUG n’est pas connu. Les cibles spécifiques de CUG-BP sont entre autres, le gène du<br />
récepteur à l’insuline et le gène CIC-1 (chloride channel). L’accumulation nucléaire et donc la<br />
fixation de CUG-BP à des motifs U/G provoque des épissages aberrants. Par exemple, l’insertion<br />
d’un codon de terminaison prématuré entre deux exons aboutit à la perte d’expression de la protéine<br />
CIC-1 sauvage et à la myotonie. Dans le cas de IR, l’élimination de l’exon 11 de l’ARNm conduit à<br />
une isoforme courte du récepteur responsable de la résistance à l’insuline observée dans la pathologie<br />
DM.<br />
4- Promoteurs alternatifs<br />
Dans le cas de la synthèse de plusieurs ARNm à partir d’un même gène, deux possibilités se<br />
présentent quant à la régulation de la transcription : soit les transcrits sont régulés par les mécanismes<br />
que l’on vient d’illustrer précédemment, c’est-à-dire l’épissage alternatif, soit chacun d’eux est régulé<br />
sous le contrôle d’un promoteur distinct. Ce dernier mécanisme peut induire des différences<br />
d’épissage en fonction des espèces, des tissus d’expression ou même des conditions<br />
environnementales. Par conséquent, on peut rencontrer simultanément les deux mécanismes.<br />
Utilisation du promoteur spécifique du muscle (pM) de l’aldolase A<br />
La spécialisation des fibres musculaires squelettiques a lieu durant la période postnatale. Elle est<br />
caractérisée par la contractibilité (fibres rapides ou lentes) et par leur métabolisme qui est soit<br />
glycolytique soit oxydatif. Ces différences sont dues à la présence de différentes protéines contractiles<br />
<strong>EPHE</strong> Banque de Monographies SVT 17
et métaboliques. L’aldolase A est une enzyme glycolytique présente en grande quantité dans les fibres<br />
musculaires adultes rapides. Le gène murin codant pour l’enzyme glycolytique aldolase A est<br />
transcrit à partir de trois promoteurs alternatifs [20]: le promoteur pM muscle spécifique qui se situe<br />
entre les promoteurs pN et pH actifs dans la majorité des tissus y compris le muscle squeletique et<br />
cardiaque. Dans les cellules C2C12, le promoteur M est activé dans les 24 heures suivant l’induction<br />
de la différenciation et les trois promoteurs sont actifs dans les phases tardives de ce processus et le<br />
restent dans les myotubes différenciés [21]. Le promoteur pM est activé spécifiquement dans les<br />
fibres musculaires glycolytiques rapides et son niveau d’expression augmente durant la période<br />
postnatale de maturation du muscle. pM est beaucoup plus actif dans les muscles du corps que de la<br />
tête. Ce promoteur est activé en deux étapes : la spécificité de fibres est acquise très tôt durant la<br />
période après la naissance alors que la dichotomie corps/tête apparaît 15 jours après la naissance.<br />
Différents sites de fixation pour des facteurs de transcription ont été caractérisés dans cette région. La<br />
génération de souris transgéniques pour cette région, soit sous sa forme sauvage ou mutée pour<br />
certains des sites a montré que les sites de fixation requis pour l’expression dans les fibres rapides par<br />
rapport aux fibres lentes ainsi que ceux utilisés par différents types de fibres rapides sont différents.<br />
Ces résultats montrent que l’utilisation d’un promoteur alternatif permet de cibler l’expression d’un<br />
gène dans un tissu donné à un moment précis.<br />
III- Régions Régulatrices de l’ARN messager<br />
La régulation de l’expression d’un gène implique un contrôle de la transcription permettant d’aboutir<br />
à la maturation de l’ARN mais aussi à un contrôle post-transcriptionnel (c’est-à-dire le transport de<br />
l’ARNm du noyau vers le cytoplasme, l’efficacité de sa traduction, sa localisation cellulaire et sa<br />
stabilité). Ce dernier contrôle se fait principalement grâce à des éléments ARN généralement situés<br />
dans les régions transcrites mais non traduites de l’ARNm (à savoir le 5’ et le 3’ UTR)<br />
1. Interactions entre la coiffe, la séquence codante et la queue polyA<br />
Comme nous l’avons précisé précedemment, des études in vitro ont montré que la mise en place de la<br />
coiffe, de l’épissage et de la polyadénylation sont dépendantes les unes des autres.<br />
En particulier, il semble que la structure de la coiffe joue un rôle important au niveau du phénomène<br />
d’épissage. L’incubation in vitro d’un pré-ARNm dans un extrait nucléaire, montre que l’addition<br />
d’une coiffe augmente de façon significative la formation de l’ARNm épissé. L’interconnexion de la<br />
coiffe et de l’épissage est importante pour l’intron le plus proximal et diminue avec la distance. Cette<br />
étroite relation implique la protéine nucléaire CBC (Cap Binding Complex) associée à la coiffe.<br />
L’élimination de la protéine CBC d’extraits nucléaires entraîne une inhibition significative de<br />
l’épissage. Des études complémentaires ont montré que CBC influe de manière positive sur<br />
l’interaction du U6snRNA avec le site donneur d’épissage en affectant le remplacement du U1snRNP<br />
par U6 [12]. Ce mécanisme montre bien qu’un épissage efficace est dépendant de la coiffe.<br />
<strong>EPHE</strong> Banque de Monographies SVT 18
Il semble que la coiffe interfère également avec la polyadénylation. Des expériences similaires ont<br />
permis de montrer que la présence de CBC stabilise le complexe de polyadénylation en présence du<br />
transcrit primaire [22].<br />
Enfin, il existe deux liens étroits entre l’épissage et la polyadénylation<br />
- Le premier consiste en la délimitation des exons dans le mécanisme d’épissage de l’ARN. Pour les<br />
exons ²internes² au gène, les sites d’épissage 3’ et 5’ sont le plus souvent reconnus par des<br />
interactions entre les facteurs d’épissage aux bornes de l’exon. Ce mécanisme de délimitation des<br />
exons est également appliqué au dernier exon du gène, bien que dans ce cas le dernier exon soit<br />
délimité par le signal de polyadénylation. L’épissage et la polyadénylation à chaque extrémité de<br />
l’exon se régulent positivement entre eux. Cette régulation fait intervenir une interaction entre le<br />
facteur d’épissage U2AF et la polyA polymérase [23].<br />
- Le second lien qui existe entre l’épissage et la polyadénylation peut être mis en évidence dans le<br />
cas d’une polyadénylation alternative. En effet, la position de la queue polyA peut être variable<br />
s’il existe plusieurs sites de clivage dans la région 3’UTR de l’ARN pré-messager. Cette<br />
polyadénylation alternative peut conduire à l’expression de différents produits à partir d’un même<br />
gène. Deux exemples ont été bien caractérisés : le gène codant pour la chaîne lourde de<br />
l’immunoglobuline M (IgM) et le gène de la calcitonine [24].<br />
Le gène IgM possède un premier site de polyadénylation dans un intron qui est sujet à une répression<br />
par le site donneur d’épissage situé en amont. Ce site est finalement éliminé par épissage de l’intron<br />
le contenant. L’ARNm résultant utilise son second site de polyadénylation situé en aval, produisant<br />
ainsi la forme membranaire de la protéine, qui prédomine au cours du développement précoce des<br />
cellules B. Dans les cellules B matures, le premier site de polyadénylation, jusque-là réprimé, va être<br />
beaucoup plus sollicité, pour synthétiser une forme sécrétée plus courte de la protéine. Dans ces<br />
cellules, contrairement aux cellules B immatures, le facteur de polyadénylation CstF-64 (Cleavage<br />
stimulation Factor-64) est fortement exprimé et cette protéine a une haute affinité pour le plus court<br />
signal de polyadénylation. Elle entre donc en compétition avec le mécanisme d’épissage [25] et<br />
favorise ainsi la synthèse de la forme courte.<br />
Une situation similaire existe pour le gène de la calcitonine. Le transcrit du gène de la calcitonine<br />
subit un épissage alternatif spécifique de tissu qui conduit au messager de la calcitonine (dans la<br />
thyroïde) ou au messager d’un neuromédiateur, le CGRP (Calcitonin Gene Related Peptide) dans le<br />
cerveau. Il semble que cet épissage alternatif résulte de la présence, dans la thyroïde, d’un élément<br />
activateur (enhancer) impliqué dans le recrutement des facteurs d’épissage conduisant à la production<br />
de messagers de la calcitonine. Dans le cerveau, cet élément de régulation positif est présent, mais ne<br />
semble plus pouvoir agir. Ceci conduit à la production de CGRP plutôt qu’à la calcitonine [24].<br />
2. Régulation par la coiffe et la queue polyA [26]<br />
Les protéines qui interagissent avec la coiffe et la queue polyA induisent généralement deux<br />
<strong>EPHE</strong> Banque de Monographies SVT 19
processus de régulations supplémentaires. Le premier consiste en la reconnaissance de l’intégrité de<br />
l’ARNm par le système de surveillance. En effet, dans le cas où des anomalies seraient détectées, ce<br />
système empêche l’export de l’ARNm vers le cytoplasme. Le second mécanisme de régulation<br />
consiste en l’export de l’ARNm dans le cytoplasme à proprement parler. Les protéines mises en jeu<br />
lors de la reconnaissance de l’intégrité de l’ARNm vont interagir avec les protéines du pore nucléaire<br />
afin de permettre le transport de cet ARNm. Ces phases de régulation permettent la prise en charge<br />
d’un ARNm ²correct² par la machinerie traductionnelle.<br />
Dans le noyau, la protéine CBC se lie à la coiffe. Elle est composée de deux sous-unités : la sousunité<br />
CBP80 qui contient un NLS (Nuclear Import Signal) classique et la sous-unité CBP20 qui<br />
contient un domaine de liaison à l’ARN de type RNP. La protéine CBC est importante pour<br />
l’épissage du transcrit primaire mais aussi pour l’export de l’ARNm du noyau vers le cytoplasme<br />
grâce à des associations/dissociations avec les sous-unités des molécules d’importines a et b et les<br />
snRNA.<br />
La queue polyA, quant à elle, est associée à la PABPII qui semble jouer un rôle dans la stabilisation<br />
des messagers et dans l’initiation de la traduction.<br />
Une fois l’ARNm exporté vers le cytoplasme, les protéines CBC et PABPII vont être remplacées<br />
respectivement par le complexe eIF4-F (eukaryotic translation Initiation Factor 4-F) et par la protéine<br />
PABPI.<br />
Le complexe eIF4-F comprend trois sous-unités : eIF4-E qui est en contact direct avec la coiffe,<br />
eIF4-A qui possède une activité hélicase dépendante de l’ATP et eIF4-G (appelé aussi p220) qui<br />
permet l’assemblage du complexe d’initiation de la traduction. Ce complexe permet la traduction de<br />
l’ARNm.<br />
La protéine PABPI recouvre la queue polyA afin de lui servir de bouclier contre les attaques des<br />
ribonucléases de la cellule. Cette protéine va donc empêcher la dégradation de l’ARNm.<br />
3. Régulation par la région 5’UTR<br />
Rappelons que la région 5’UTR est délimitée par le site d’initiation de la transcription d’un côté et le<br />
site de démarrage de la traduction de l’autre. La distance qui sépare ces deux sites peut varier puisque<br />
dans un gène présentant plusieurs promoteurs, la transcription peut être initié à partir de plusieurs sites<br />
de démarrage différents. Ce phénomène conduirait donc à la synthèse de régions 5’UTR différentes<br />
pour un même ARNm. La région 5’UTR peut varier en taille car la traduction peut démarrer à<br />
différents sites, permettant ainsi la synthèse de protéines avec des régions N-terminal différentes.<br />
Une des premières régulations de la région 5’UTR est sa longueur. En effet, la distance entre la coiffe<br />
et le codon d’initiation de la traduction semble jouer un rôle sur l’efficacité de l’initiation de la<br />
traduction. La longueur minimale requise pour permettre la reconnaissance du premier codon AUG,<br />
est d’environ 20 nucléotides, mais elle peut être compensée par la présence de structures secondaires<br />
en aval de l’ATG [27]. Au-delà de 20 nucléotides, l’efficacité de l’initiation de la traduction<br />
augmente avec la taille. Ceci pourrait s’expliquer en partie par l’accumulation de nombreuses sousunités<br />
40S sur ces longs 5’UTR conférant ainsi un avantage pour la traduction. Des études ont montré<br />
<strong>EPHE</strong> Banque de Monographies SVT 20
qu’une région UTR riche en dinucléotides GC est néanmoins beaucoup plus courte qu’une région<br />
UTR pauvre en GC.<br />
Plusieurs éléments régulateurs post-transcriptionnels spécifiques à la région 5’UTR ont été décris.<br />
Ainsi, on peut retrouver en plus de la coiffe :<br />
- des IRES (Internal Ribosome Entry Site) ou sites internes d’entrée des ribosomes qui peuvent<br />
permettre la traduction de plusieurs protéines à partir d’un seul ARNm. L’IRES permet la traduction<br />
sans reconnaissance de la coiffe par le ribosome.<br />
- les uORF (upstream Open Reading Frame). Ce sont de petits cadres de lecture qui peuvent interférer<br />
avec le site préférentiel d’initiation de la traduction du gène considéré.<br />
- des structures secondaires en épingle à cheveux qui soit empêchent le balayage de l’ARNm par les<br />
ribosomes soit permettent l’interaction entre l’ARN et des protéines régulatrices pour moduler la<br />
traduction.<br />
3-1- IRES (Internal Ribosomal Entry Site)<br />
L’IRES est une structure d’initiation de la traduction qui ne nécessite pas la reconnaissance de la<br />
coiffe par le ribosome. L’activité IRES est dépendante non pas du codon d’initiation de la traduction<br />
(AUG) mais de structures secondaires ou tertiaires, de facteurs trans-activateurs, ou de séquences<br />
complémentaires à la sous-unité 18S de l’ARNr [28]. Cette initiation nécessite la présence des<br />
facteurs d’initiation de la traduction eIFs, à l’exception de eIF-4E (qui reconnaît spécifiquement la<br />
coiffe). La majorité des IRES sont d’origine virale. Seules quelques-unes ont été décrites comme étant<br />
d’origine cellulaire. Les séquences IRES cellulaires sont fréquemment activées lorsque la protéine<br />
normalement synthétisée (de manière coiffe dépendante) est inhibée.<br />
L’ARNm de c-myc comporte un long et complexe 5’UTR contenant un IRES. C-myc est un<br />
protooncogène impliqué dans la régulation de la prolifération et l’apoptose. L’activité de l’IRES cmyc<br />
dépend du type cellulaire et du stimulus appliqué à la cellule. Ainsi, lorsque la cellule entre en<br />
apoptose, la traduction dépendante de la coiffe diminue, probablement par le clivage de eIF-4G ainsi<br />
que d’autres facteurs de la traduction par les caspases et l’activité IRES augmente. D’autres gènes<br />
impliqués dans la régulation de l’apoptose contiennent un IRES dans leur extrémité 5’UTR. C’est le<br />
cas de Apaf-1 (Apoptosis protease activating factor-1) et de XIAP (X-linked Inhibitor Apoptosis<br />
Protein).<br />
Au cours de la phase G2/M du cycle cellulaire, la synthèse des protéines dépendante de la coiffe est<br />
inhibée. C’est le cas pour les protéines kinases PITSLRE qui appartiennent à la famille des kinases<br />
dépendantes des cyclines [29]. Elles agissent comme des gènes suppresseurs de tumeurs et ont été<br />
montré comme ayant un rôle dans la progression du cycle cellulaire. Deux isoformes des protéines<br />
kinases PITSLRE existent : p110 PITSLRE et p58 PITSLRE . p110 PITSLRE est produite par traduction<br />
dépendante de la coiffe alors que p58PITSLRE résulte d’une traduction dépendante d’une IRES. Lors<br />
de la phase G2/M du cycle cellulaire, l’ARNm des protéines kinases PITSLRE n’est pas traduit de<br />
manière dépendante à la coiffe. En effet, lorsque l’inhibition de la traduction dépendante de la coiffe<br />
<strong>EPHE</strong> Banque de Monographies SVT 21
est levée, seule la protéine p110 PITSLRE est synthétisée. En contrepartie, lorsque la traduction<br />
dépendante de la coiffe est inhibée, seule la protéine p58 PITSLRE est présente. Ces observations<br />
révèlent donc un nouveau mécanisme de régulation de la traduction pendant la progression du cyle<br />
cellulaire.<br />
En général, la traduction d’ARNm par l’intermédiaire d’un IRES est activée lorsque les conditions ne<br />
sont pas favorables à une traduction coiffe dépendante. C’est le cas de l’apoptose et de l’arrêt du<br />
cycle cellulaire.<br />
3-2- uORFs (upstream Open Reading Frame)<br />
Il semble que la reconnaissance de la séquence de l’ARNm par le complexe ribosomal nécessite en<br />
plus du contexte optimal du codon d’initiation de la traduction établit par Kozak : 5’GCCRCCaugG3’,<br />
des éléments régulateurs situés en 5’UTR [30]. C’est ainsi que les uORFs ont été décrits. Ce sont de<br />
petits cadres de lecture ouverts en amont de l’ATG. Tous les ARNm ne sont pas fonctionnels. Dans<br />
certains cas, ces transcrits sont traduits en quantité équivalente à l’ARN fonctionnel majoritaire. Dans<br />
d’autre cas, un transcrit incomplet peut parfois être plus abondant que l’ARN entièrement épissé et<br />
théoriquement traduisible.<br />
Après la reconnaissance et la traduction d’un uORF, le ribosome a quatre possibilités [31]:<br />
- Le ribosome reste associé à l’ARNm et continue à avancer sur le messager.<br />
- Le ribosome peut réinitier plus en aval après être resté associé et avoir avancé sur l’ARNm. Cette<br />
réinitiation peut se faire aussi bien à un codon AUG proximal qu’à un codon AUG distal. Les<br />
ribosomes traduisent souvent le petit cadre de lecture ouvert (uORF) et réinitient en aval avec une<br />
grande efficacité, n’affectant pas l’expression du gène considéré. Cependant, la taille du cadre de<br />
lecture (ORF) est un facteur limitant lors de réinitiation chez les eucaryotes. Cette réinitiation ne<br />
peut avoir lieu qu’après la traduction d’un premier cadre de lecture court mais en aucun cas après<br />
la traduction d’un premier cadre de lecture long et entier. La raison pour laquelle la réinitiation est<br />
fréquemment liée à la taille du premier cadre de lecture peut s’expliquer par le fait que certains<br />
facteurs impliqués dans l’initiation de la traduction se dissocient du ribosome progressivement<br />
pendant la phase d’élongation. Par conséquent, si la phase d’élongation est brève (dans le cas d’un<br />
premier cadre de lecture court), les facteurs requis pour la réinitiation d’un nouveau cadre de<br />
lecture seront présents. Ceci ne sera pas le cas, si la première initiation de la traduction a lieu à<br />
partir d’un cadre de lecture long et entier.<br />
- Le ribosome s’arrête en cours de la phase d’élongation ou de terminaison de la traduction de<br />
l’uORF, créant ainsi un blocus. Dans ce cas, la structure du peptide codée par l’uORF serait à<br />
l’origine de l’arrêt. Il semblerait que ce peptide interagisse avec la machinerie traductionnelle.<br />
Cette interaction semble perturber l’expression du gène lui-même et bloquer toute nouvelle<br />
traduction à partir d’un uORF plus en aval.<br />
- L’uORF synthétisée peut affecter l’expression du gène en altérant la stabilité de son messager. En<br />
effet, il semblerait qu’un complexe multiprotéique agisse au niveau de la terminaison de la<br />
traduction dans le but de réguler le devenir du ribosome et de l’ARNm. A ce moment là, l’uORF a<br />
<strong>EPHE</strong> Banque de Monographies SVT 22
la possibilité de provoquer la dégradation de l’ARNm et donc d’éliminer l’expression du gène. Le<br />
mécanisme qui entraîne cette dégradation est très mal connu.<br />
D’autre part, il existe des mécanismes qui éliminent les uORFs quand une forte synthèse de protéine<br />
est requise dans un tissu précis ou à un moment donné.<br />
En conclusion, les uORFs agissent au niveau de l’expression des gènes. Dans certains cas, ils servent<br />
d’éléments régulateurs importants.<br />
3-3- Présence de Structures Secondaires<br />
Le contrôle de la traduction d’un ARNm peut également être modulé par des interactions entre des<br />
séquences de réponse spécifiques à structures secondaires et des protéines régulatrices de l’initiation<br />
de la traduction, qui sont généralement des répresseurs. C’est le cas du facteur IRP1 (Iron Responsive<br />
Protein-1) [28]. Ce facteur se lie à un motif IRE (Iron Responsive Element) de manière dépendante à<br />
une homéostasie en fer dans la cellule. Le motif IRE correspond à une épingle à cheveux et est<br />
localisé près de la coiffe dans la région 5’UTR de l’ARNm de la ferritine. Cette protéine est requise<br />
pour le stockage du fer ainsi que pour son utilisation sauf lorsque le niveau en fer de la cellule est trop<br />
faible. En effet, si la quantité de fer intracellulaire est insuffisante, cela accroît l’activité de liaison de<br />
IRP1 à la structure en épingle à cheveux IRE. Ce complexe est stabilisé par IRP2 (Iron Responsive<br />
Protein-2). La liaison de IRP à IRE empêche l’accrochage du complexe ribosomale 40S à l’ARNm et<br />
donc inhibe fortement la traduction de la ferritine. Inversement, lorsque la concentration en fer est<br />
élevée, IRP2 est dégradée par le protéasome et IRP1 capture les ions fer, ce qui l’empêche de se lier<br />
au motif IRE. Dans ces conditions, les facteurs d’initiation à activité hélicase (eIFs) détruisent la<br />
structure en épingle à cheveux de l’IRE, et permettent l’entrée et la fixation à l’ARNm du complexe<br />
de pré-initiation 40S. Le ribosome ainsi assemblé peut donc entraîner l’initiation de la traduction.<br />
4. Régulation par la région 3’UTR<br />
La région 3’UTR se situe entre le codon de fin de la traduction et la queue polyA. Cette région peut<br />
être variable s’il existe plusieurs codons stop, des épissages alternatifs du dernier exon et un usage<br />
alternatif de sites de polyadénylation. On a pu constater que la région 3’UTR est impliquée dans la<br />
fixation de certains facteurs d’élongation (eIFs) ainsi que dans la réinitiation de la traduction en<br />
permettant de recycler les sous-unités ribosomales en direction de l’extrémité 5’ du même ARNm.<br />
Par conséquent, la région 3’UTR participe à l’optimisation de l’initiation de la traduction.<br />
Cette région est également impliquée dans le contrôle de la traduction, la localisation sub-cellulaire et<br />
la stabilité des messagers par l’intermédiaire d’éléments régulateurs tels que :<br />
- des éléments de polyadénylation cytoplasmique riches en U nommés CPE<br />
- des éléments de désadénylation riches en A + U nommés ARE (AU Rich Element)<br />
- des éléments de réponse (de type tige-boucle) à des facteurs spécifiques<br />
<strong>EPHE</strong> Banque de Monographies SVT 23
4-1- CPE (Cytoplasmic Polyadenylation Element)<br />
La présence et la taille de la queue polyA contribuent à l’efficacité de la traduction des ARNm. La<br />
longueur de la séquence polyA des ARNm cytoplasmiques varie. Elle est régie par un phénomène<br />
dynamique qui dépend de séquences spécifiques de l’ARNm ainsi que du type cellulaire, ceci<br />
indépendamment des événements nucléaires. La taille de la queue polyA de l’ARNm est réduite au<br />
cours du temps, mais la vitesse de désadénylation varie en fonction de l’ARNm, du type cellulaire et<br />
de l’efficacité de traduction. Des réactions de désadénylation précèdent la dégradation de l’ARNm.<br />
Dans certaines circonstances, des réactions de ré-adénylation peuvent se produire dans le cytoplasme.<br />
Ces réactions de ré-adénylation cytoplasmiques ont lieu au moment où l’ARNm devient traductible et<br />
est recruté par la machinerie traductionnelle. Ces réactions nécessitent le signal AAUAAA, le CPSF<br />
et la PAP, comme cela est le cas dans le noyau, mais aussi une séquence riche en résidus U, appelée<br />
CPE. Le mécanisme par lequel le motif CPE permet la fixation de la CPEB (CPE Binding protein)<br />
pour entraîner la polyadénylation cytoplasmique n’est pas encore clairement établi.<br />
4-2- ARE (AU Rich Element)<br />
On sait que la présence de la coiffe s’oppose à la digestion des ARNm par des exoribonucléases dans<br />
le sens 5’-3’. Deux mécanismes indiquent que la queue polyA protège également les ARNm de la<br />
dégradation. L’un de ces mécanismes a déjà été évoqué puisqu’il s’agit de l’interaction de la PABP<br />
sur la queue polyA, formant ainsi un complexe qui protège les ARNm polyadénylés contre leur<br />
digestion par les exoribonucléases dans le sens 3’-5’. Le second mécanisme correspond à l’étape qui<br />
précède la dégradation des ARNm : la désadénylation. Les séquences qui stimulent ce mécanisme et<br />
favorisent donc la dégradation des messagers sont des séquences riches en résidus A et U et sont<br />
localisées dans la région 3’UTR des messagers de courte durée de vie : les ARE. Aucune séquence<br />
consensus n’a été rigoureusement établie, mais une classification a été proposée, divisant les ARE en<br />
trois groupes [32].<br />
Le premier groupe est constitué par les séquences renfermant une ou plusieurs copies du motif<br />
pentamérique AUUUA (classe I) ou tétramérique AUUU (classe II), entouré de diverses répétitions de<br />
A et U, et couplé à une longue région continue riche en U.<br />
Le second groupe consiste en des séquences divisées en deux domaines dont un est formé par environ<br />
60% de A ou U et un autre domaine constitué par trois copies du motif pentamérique GUUUG.<br />
Le troisième groupe contient une continuité de U sans aucun pentamère.<br />
La seule protéine isolée capable de se fixer sur les ARE est : AUF1 (AU Factor 1). Sa fixation induit<br />
in vitro la déstabilisation des ARNm de c-myc et du GM-CSF par exemple. Cependant, il semble<br />
qu’il existe d’autres protéines non encore identifiées capables d’induire au contraire la stabilisation de<br />
ces messagers.<br />
L’ARE est donc reconnu par différents facteurs qui, selon leur nature, stabilisent ou déstabilisent<br />
l’ARNm. Ceci permet la synthèse de protéines à des moments précis dans de conditions particulières.<br />
<strong>EPHE</strong> Banque de Monographies SVT 24
4-3- Présence de Structures Secondaires<br />
Si l’on reprend le cas de la ferritine, on s’aperçoit que ce même élément de réponse au fer de type<br />
tige-boucle IRE est également présent en 5 exemplaires dans la région 3’UTR de l’ARNm du<br />
récepteur de la transferrine (TfR) [28]. En présence de faibles concentrations en fer, les protéines<br />
IRP1et IRP2 inhibent la traduction de l’ARNm de la ferritine. En revanche, ces protéines stabilisent<br />
l’ARNm codant pour la TfR. Ceci aboutit à une augmentation du taux de ce récepteur permettant<br />
ainsi à la cellule d’absorber le fer par endocytose de la transferrine. Inversement, lorsque la<br />
concentration en fer est élevée, les protéines IRP1 et IRP2 ne sont plus actives. En effet, elles<br />
n’empêchent plus la traduction du messager de la ferritine et par conséquent le stockage du fer dans la<br />
cellule. En parallèle, elles ne protègent plus la région 3’UTR de l’ARNm du récepteur à la<br />
transferrine. Cet ARNm est donc susceptible d’être dégradé par des endoribonucléases dans le sens<br />
3’-5’. Ainsi selon les stimuli reçus par la cellule ou les variations cellulaires, les ARNm présentant<br />
des séquences particulières dans leur région 3’UTR sont dégradés ou stabilisés afin qu’une protéine<br />
soit ou non synthétisée<br />
En conclusion, les séquences ou les structures présentes dans les régions 5’UTR et 3’UTR sont très<br />
importantes pour la stabilité et la localisation des messagers mais aussi pour l’efficacité de la<br />
traduction d’un messager.<br />
5. Conclusion<br />
Tous les mécanismes que nous avons évoqués ici, à savoir l’utilisation de promoteurs alternatifs, les<br />
mécanismes d’épissages alternatifs mais aussi les régulations par les régions 5’ et 3’ des ARN<br />
messagers, permettent une grande variabilité tant au niveau de l’ARNm qu’au niveau de la protéine.<br />
Ils sont importants et nécessaires car ils permettent l’expression d’une protéine à un moment donné<br />
dans une cellule définie. Ceci confirme bien l’hypothèse selon laquelle la complexité moléculaire se<br />
situe en aval des gènes (ou du génome) et plus particulièrement au niveau des étapes de la<br />
transcription et de la traduction. Cependant d’autres mécanismes, non évoqués ici, sont capables<br />
d’induire encore une plus grande diversité protéique en régulant l’état de la chromatine, l’édition des<br />
ARN, l’interférence par les ARN ou les modifications post-traductionnelles.<br />
La régulation de la myogenèse fait intervenir certains de ces mécanismes, comme nous l’avons vu à<br />
travers les exemples d’épissages et de promoteurs alternatifs.<br />
Au laboratoire, nous avons isolé une protéine impliquée dans la différenciation musculaire régulée<br />
par la voie de signalisation PI3-K: la protéine CKIP-1.<br />
BIBLIOGRAPHIE<br />
1. Flores O, Lu H, Reinberg D: Factors involved in specific transcription by mammalian<br />
RNA polymerase II. Identification and characterization of factor IIH. J Biol Chem 1992;<br />
267:2786-2793.<br />
<strong>EPHE</strong> Banque de Monographies SVT 25
2. Boisclair YR, Brown AL, Casola S, Rechler MM: Three clustered Sp1 sites are required for<br />
efficient transcription of the TATA-less promoter of the gene for insulin-like growth<br />
factor-binding protein-2 from the rat. J Biol Chem 1993; 268:24892-24901.<br />
3. O'Shea-Greenfield A, Smale ST: Roles of TATA and initiator elements in determining the<br />
start site location and direction of RNA polymerase II transcription. J Biol Chem 1992;<br />
267:6450.<br />
4. Lagrange T, Kapanidis AN, Tang H, Reinberg D, Ebright RH: New core promoter element<br />
in RNA polymerase II-dependent transcription: sequence-specific DNA binding by<br />
transcription factor IIB. Genes Dev 1998; 12:34-44.<br />
5. Kadonaga JT: The DPE, a core promoter element for transcription by RNA polymerase<br />
II. Exp Mol Med 2002; 34:259-264.<br />
6. Wang T, Lafuse WP, Zwilling BS: NFkappaB and Sp1 elements are necessary for maximal<br />
transcription of toll-like receptor 2 induced by Mycobacterium avium. J Immunol 2001;<br />
167:6924-6932.<br />
7. Lania L, Majello B, De Luca P: Transcriptional regulation by the Sp family proteins. Int J<br />
Biochem Cell Biol 1997; 29:1313-1323.<br />
8. Chalkley GE, Verrijzer CP: DNA binding sites selection by RNA ploymerase II TAFs: a<br />
TAFII250-TAFII150 complex recognizes the Initiator. Embo J 1999; 18:4835-4845.<br />
9. Burke TW, Kadonaga JT: The downstream core promoter element, DPE, is conserved<br />
from Drosophila to humans and is recognized by TAFII60 of Drosophila. Genes Dev<br />
1997; 11:3020-3031.<br />
10. Kutach AK, Kadonaga JT: The downstream promoter element DPE appears to be as<br />
widely used as the TATA box in Drosophila core promoters. Mol Cell Biol 2000; 20:4754-<br />
4764.<br />
11. Proudfoot NJ: Genetic dangers in poly(A) signals. EMBO Rep 2001; 2:891-892.<br />
12. Proudfoot NJ, Furger A, Dye MJ: Integrating mRNA processing with transcription. Cell<br />
2002; 108:501-512.<br />
13. Moore MJ, Sharp PA: Evidence for two active sites in the spliceosome provided by<br />
stereochemistry of pre-mRNA splicing. Nature 1993; 365:364-368.<br />
14. Russo S, Tomatis D, Collo G, Tarone G, Tato F: Myogenic conversion of NIH3T3 cells by<br />
exogenous MyoD family members: dissociation of terminal differentiation from myotube<br />
formation. J Cell Sci 1998; 111:691-700.<br />
15. Belkin AM, Zhidkova NI, Balzac F, Altruda F, Tomatis D, Maier A, Tarone G, Koteliansky<br />
VE, Burridge K: Beta 1D integrin displaces the beta 1A isoform in striated muscles:<br />
localization at junctional structures and signaling potential in nonmuscle cells. J Cell Biol<br />
1996; 132:211-226.<br />
16. Martin JF, Miano JM, Hustad CM, Copeland NG, Jenkins NA, Olson EN: A Mef2 gene that<br />
generates a muscle-specific isoform via alternative mRNA splicing. Mol Cell Biol 1994;<br />
14:1647-1656.<br />
17. Buj-Bello A, Furling D, Tronchere H, Laporte J, Lerouge T, Butler-Browne GS, Mandel JL:<br />
<strong>EPHE</strong> Banque de Monographies SVT 26
Muscle-specific alternative splicing of myotubularin-related 1 gene is impaired in DM1<br />
muscle cells. Hum Mol Genet 2002; 11:2297-2307.<br />
18. Groenen PJ, Wansink DG, Coerwinkel M, van den Broek W, Jansen G, Wieringa B:<br />
Constitutive and regulated modes of splicing produce six major myotonic dystrophy<br />
protein kinase (DMPK) isoforms with distinct properties. Hum Mol Genet 2000; 9:605-<br />
616.<br />
19. Charlet BN, Savkur RS, Singh G, Philips AV, Grice EA, Cooper TA: Loss of the musclespecific<br />
chloride channel in type 1 myotonic dystrophy due to misregulated alternative<br />
splicing. Mol Cell 2002; 10:45-53.<br />
20. Salminen M, Spitz F, Fiszman MY, Demignon J, Kahn A, Daegelen D, Maire P: Myotubespecific<br />
activity of the human aldolase A M-promoter requires an overlapping binding<br />
site for NF1 and MEF2 factors in addition to a binding site (M1) for unknown proteins. J<br />
Mol Biol 1995; 253:17-31.<br />
21. Salminen M, Lopez S, Maire P, Kahn A, Daegelen D: Fast-muscle-specific DNA-protein<br />
interactions occurring in vivo at the human aldolase A M promoter are necessary for<br />
correct promoter activity in transgenic mice. Mol Cell Biol 1996; 16:76-85.<br />
22. Flaherty SM, Fortes P, Izaurralde E, Mattaj IW, Gilmartin GM: Participation of the nuclear<br />
cap binding complex in pre-mRNA 3' processing. Proc Natl Acad Sci U S A 1997;<br />
94:11893-11898.<br />
23. Vagner S, Vagner C, Mattaj IW: The carboxyl terminus of vertebrate poly(A) polymerase<br />
interacts with U2AF 65 to couple 3'-end processing and splicing. Genes Dev 2000; 14:403-<br />
413.<br />
24. Zhao J, Hyman L, Moore C: Formation of mRNA 3' ends in eukaryotes: mechanism,<br />
regulation, and interrelationships with other steps in mRNA synthesis. Microbiol Mol Biol<br />
Rev 1999; 63:405-445.<br />
25. Takagaki Y, Seipelt RL, Peterson ML, Manley JL: The polyadenylation factor CstF-64<br />
regulates alternative processing of IgM heavy chain pre-mRNA during B cell<br />
differentiation. Cell 1996; 87:941-952.<br />
26. Dreyfuss G, Hentze M, Lamond AI: From transcript to protein. Cell 1996; 85:963-972.<br />
27. Pallier C: Les régions non traduites des ARN messagers et leur rôle dans la synthèse<br />
protéique. Medecine et Sciences 2001; 17:23-32.<br />
28. Meijer HA, Thomas AA: Control of eukaryotic protein synthesis by upstream open<br />
reading frames in the 5'-untranslated region of an mRNA. Biochem J 2002; 367:1-11.<br />
29. Cornelis S, Bruynooghe Y, Denecker G, Van Huffel S, Tinton S, Beyaert R: Identification<br />
and characterization of a novel cell cycle-regulated internal ribosome entry site. Mol Cell<br />
2000; 5:597-605.<br />
30. Kozak M: Initiation of translation in prokaryotes and eukaryotes. Gene 1999; 234:187-<br />
208.<br />
31. Morris DR, Geballe AP: Upstream open reading frames as regulators of mRNA<br />
translation. Mol Cell Biol 2000; 20:8635-8642.<br />
<strong>EPHE</strong> Banque de Monographies SVT 27
32. Zhang T, Kruys V, Huez G, Gueydan C: AU-rich element-mediated translational control:<br />
complexity and multiple activities of trans-activating factors. Biochem Soc Trans 2002;<br />
30:952-958.<br />
<strong>EPHE</strong> Banque de Monographies SVT 28