Denis LE PASLIER - CNRS
Denis LE PASLIER - CNRS
Denis LE PASLIER - CNRS
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Bouche d’égout de la Cloaca maxima<br />
se jetant dans le Tibre<br />
Si la légende dit que lorsque l’on met la main dans la Bouche de la Vérité, on ne peut l’en<br />
ressortir que si l’on n’a jamais menti…<br />
Il en est fait une fonction beaucoup plus terre à terre qui lui fut assignée par le passé: celle d’une<br />
bouche d’égout de la Cloaca maxima ̏ le très grand égout˝ construit pour assécher la vallée du<br />
Forum Romain, dont la construction a été entreprise par Tarquin l’Ancien (Lucius Tarquinius<br />
Priscus, 5 ème Roi de Rome, 534 à 509 av. J-C.)
Cloaca maxima<br />
rencontre entre les anciens et les modernes<br />
<strong>Denis</strong> Le Paslier<br />
Ecole Thématique Expert Génomique Environnementale (ETEGE)<br />
23 - 27 Avril 2012, Aussois
Depuis les Romains le traitement des eaux a évolué…
Traitements<br />
primaires<br />
eau<br />
ésiduaire<br />
Décanteur<br />
primaire<br />
Principe de l’épuration<br />
Traitement des eaux<br />
Bassins<br />
biologiques<br />
Recirculation<br />
Traitement des boues<br />
digestion anaérobie<br />
Clarificateur<br />
secondaire<br />
Extraction<br />
des boues en excès<br />
eau traitée<br />
boues traitées
Flottateur<br />
Décanteur<br />
primaire<br />
Bassin<br />
d'anoxie Bassin aérobie<br />
Digesteur
Inventaire des microorganismes<br />
Inventaire des gènes<br />
Objectifs<br />
Inventaire des activités enzymatiques<br />
Quels sont les processus métaboliques impliqués dans le traitement des eaux,<br />
avec un intérêt particulier pour la digestion anaérobie
Un inventaire moléculaire a été réalisé par l’approche classique de<br />
clonage et séquençage de produits PCR ciblant l’ADNr 16S :<br />
trois principaux bassins : aérobie<br />
anoxie<br />
digesteur anaérobie mésophile<br />
avec amorces spécifiques : Archaea, Bacteria, Planctomycetales,<br />
Acidobacteria, Verrucomicrobia, WS6, BRC1<br />
une grande diversité d’Archaea et Bacteries<br />
nouvelles lignées phylogénétiques et<br />
nouvelles divisions candidates bactériennes<br />
Chouari et al., Microb. Ecol. 2010<br />
Chouari et al., Environ. Microbiol. 2005<br />
Chouari et al., Appl. Environ. Microbiol. 2005<br />
Chouari et al., Appl. Environ. Microbiol. 2003
Bassin aérobie<br />
BACs<br />
> 564 000 clones -> 330 K lectures<br />
taille moyenne 60 kb<br />
Digesteur anaérobie mésophile<br />
Fosmides<br />
1 M clones -> 1,8 M lectures<br />
plasmides 3kb -> 1 M lectures
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
0 10 20 30 40 50 60 70 80 90 100<br />
G + C % distribution<br />
FES<br />
PES<br />
GS-FLX<br />
454
Hypothèse : existe-t-il d’autres divisions bactériennes inconnues?<br />
Hybridations<br />
Sondes oligonucléotidiques (ex: Eub338 I, II, III …)<br />
Sondes complexes (ADNr 16S à partir de pools de produits PCR<br />
représentatifs des différentes divisions bactériennes<br />
(Archaea, Planctomycetales, OP11, WS6 etc …)<br />
Digesteur anaérobie 1 membrane (27 648 Fosmides)<br />
599 fosmides<br />
séquençage direct à partir de 4 amorces<br />
8 330 1100 1517
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
16S rRNA gene distribution<br />
Archara + 40 divisions bactériennes<br />
%FES<br />
%PES<br />
%FOS<br />
%FLX<br />
r454%
Découverte d’une nouvelle division bactérienne : WWE3<br />
Séquençage ADNr 16S (avec amorces universelles) ne donne rien sur 30 fosmides<br />
Séquençage d’un de ces fosmides : contient un ADNr 16S (et 23S)<br />
Cet ADNr 16S ne peut être amplifié ni séquencé par amorces universelles car Il y a au moins deux<br />
mis-appariements avec ces amorces<br />
Ces 30 fosmides ont la même séquence d’ADNr 16S<br />
WWE3 représente 5% des fosmides (5% des bactéries?)<br />
Une seule séquence similaire dans les bases de données (88% d’identité)<br />
Amorces spécifiques pour PCR et FISH : détecté dans 20 / 48 digesteurs testés
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
%FES<br />
%PES<br />
%FOS<br />
%FLX<br />
r454%
WWE1: une nouvelle division candidate bactérienne<br />
10% des ADNr 16S<br />
séquençage de fosmides "16S"<br />
recherche de séquences<br />
d’extrémité de fosmides<br />
chevauchantes<br />
(Blastn2, RI 99% & RZ 0,9)<br />
couverture homogène et élevée<br />
(10 à 15 X)<br />
Il devrait être possible d’assembler<br />
de grands fragments de génome<br />
d’un représentant de cette<br />
division candidate
Assemblage itératif<br />
(. . .)<br />
≥ 99% identité & ≥ 90% longueur lecture<br />
1. ancrage : fosmide<br />
2. lectures ancres<br />
3. lectures opposées<br />
4. assemblage<br />
5. sélection des contigs<br />
6. itérations...
"Candidatus Cloacamonas aminacidovorans" (2,2% des FES)<br />
a disparu du digesteur d’Evry depuis la construction de la banque de fosmides<br />
Mais a réapparu et disparu plusieurs fois depuis<br />
Cloacamonas a été détecté par PCR dans 13 / 43 digesteurs anaérobies testés<br />
(Amérique, Europe) et d’autres représentants de la division candidate WWE1 dans 32<br />
/ 43<br />
A été maintenu en culture pendant plus de 2 ans, mais toujours en très faible quantité
lectures<br />
Assemblage<br />
taille<br />
moyenne<br />
(pb)<br />
N<br />
lectures<br />
%<br />
assemblées<br />
Fosmides 40 kb FES 645 1,8E+06 48<br />
pCNS 3 kb PES 662 1,0E+06 47<br />
454 FLX 231 3,4E+05 26<br />
contigs supercontigs<br />
Nombre 7495 2827<br />
total Mb 75 102<br />
taille moyenne (kb) 10 36<br />
plus grand (kb) 894 5705<br />
30 supercontigs plus grands que 500 kb
Digesteur anaérobie Evry<br />
Library sequence # reads average in assembly fraction assembled<br />
size bp RI>=99 & RZ >= 0,9 Arachne<br />
Fosmid FES 1,7 M 645.3 40.1% 47.6<br />
Plasmid PES 1 M 665.6 41.7% 46.8<br />
GS-FLX 342 K 231.5 11.5% 26.2<br />
7495 contigs organisés en 2827 scaffolds (75 Mb total)<br />
40 -50 % FES dans assemblage Arachne<br />
Sondes choisies 50% FES dans assemblage Arachne
SC_Id Mb GC% Organism<br />
0 5,7 0,62 Methanomicrobiales xxx Archaea<br />
1 4,6 0,49 Bacteroidetes xxx 16S rDNA<br />
2 3,7 0,64 Betaproteobacteria xxx protéines ribosomales<br />
3 3,0 0,62 Verruvomicrobiales inconnus<br />
4 2,8 0,40 Bacteroidetes<br />
5 2,8 0,52 Methanosarcinales<br />
6 2,2 0,38 Cloacamonas<br />
7 2,2 0,66 Actinobacteria<br />
8 2,1 0,66 Actinobacteria<br />
9 2,2 0,56 Deltaproteobacteria<br />
10 1,9 0,57 Synergistetes<br />
11 2,0 0,58 Methanomicrobiales<br />
12 1,6 0,55 Deltaproteobacteria<br />
13 1,1 0,55<br />
14 1,7 0,42 Methanomicrobiales<br />
15 1,3 0,40 WWE1<br />
16 0,9 0,57<br />
17 0,7 0,39 OD1<br />
18 0,7 0,35 WWE3<br />
19 0,9 0,49<br />
20 0,6 0,35 WS6<br />
21 0,6 0,47<br />
22 0,5 0,49<br />
23 0,6 0,40 ZB2<br />
25 0,5 0,35<br />
26 0,7 0,50 Betaproteobacteria<br />
28 0,6 0,58<br />
33 0,6 0,44<br />
36 0,7 0,56<br />
41 0,6 0,48<br />
4 Archaea<br />
6 divisions candidates<br />
10 affiliation inconnue !<br />
Annotation MaGe
8 scaff
Sequence capture : un outil pour la métagénomique ?
Un des problèmes majeurs en génétique humaine : le séquençage de nombreux génomes<br />
Coût du séquençage en baisse<br />
Projet 1000 génomes etc.<br />
1000 US$<br />
Première approche : séquençage exome (30 Mb, 85% mutations responsables maladies génétiques)<br />
Stratégie développée par Roche Nimblegen: Direct Genomic Selection (DGS)<br />
the Sequence Capture Human Exome 2.1M Array to capture ~ 180,000 coding exons<br />
=> Application à la métagénomique ex: MetaHit 3,9 M génes = 1,5 M incomplets<br />
qques ref:<br />
Basiardes S et al., (2005) Direct Genomic Selection. Nature Methods 1, 63-69.<br />
Kahvejian A et al., (2008) What would you do if you could sequence everything? Nature Biotechnology 26, 1125 - 1133.<br />
Mamanova et al., (2010) Target-enrichment strategies for nextgeneration sequencing, Nature methods 2010<br />
Feb;7(2):111-8<br />
Biesecker L. (2010) Exome sequencing makes medical genomics a reality. Nature Genetics. 42:13-14.
ADN<br />
18 mars 2002, fosmides, plasmides, GS-FLX<br />
3 µg, shearing, 500 pb sizing<br />
+ adaptors Titanium<br />
amplification (10x) durant séquençage Titanium ou Illumina<br />
Sondes<br />
contigs (gènes incomplets) 10 K<br />
FES 2,4 M<br />
Enlever redondance etc. 6 M sondes<br />
2,1 M spots<br />
50 – 98 bases 70 moyenne
#reads<br />
GC%<br />
FES<br />
capture
FES # Hits<br />
Phage terminase 11601<br />
Phage terminase, large subunit 6699<br />
decarboxylase 6107<br />
Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 4988<br />
Glycosyltransferase 4212<br />
GTP-binding protein 3729<br />
Phage terminase large subunit 3622<br />
Integrase 3415<br />
Phage protein 3079<br />
Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 2400<br />
Capture<br />
decarboxylase 1028<br />
Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 925<br />
GTP-binding protein 848<br />
Translation elongation factor G 598<br />
Excinuclease ABC subunit A 585<br />
Glycosyltransferase 564<br />
DNA-directed RNA polymerase beta' subunit (EC 2.7.7.6) 528<br />
Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 499<br />
DNA-directed RNA polymerase beta subunit (EC 2.7.7.6) 492<br />
Copper-translocating P-type ATPase (EC 3.6.3.4) 459<br />
Top 10 subsystems (élimination de la redondance lors du choix des sondes) MG-RAST
G + C % similaire mais différences<br />
Redondance peu de séquences identiques OK<br />
Elimination "repeats" (sondes) OK<br />
Scaffolding > 150 contigs reliés par captures OK<br />
Séquences nouvelles # 15% OK<br />
Assemblage 90% captures dans assemblage OK<br />
Incomplets + sondes + captures<br />
25 Mb nouveaux contigs OK
Digesteur anaérobie Evry<br />
Library sequence # reads average in assembly fraction assembled<br />
size bp RI>=99 & RZ >= 0,9 Arachne<br />
Fosmid FES 1,7 M 645.3 40.1% 47.6<br />
Plasmid PES 1 M 665.6 41.7% 46.8<br />
GS-FLX 342 K 231.5 11.5% 26.2<br />
7495 contigs organisés en 2827 scaffolds (75 Mb total)<br />
40 -50 % FES dans assemblage Arachne<br />
Sondes choisies 50% FES dans assemblage Arachne
Conclusions<br />
Les stations d’épurations des eaux usées hébergent une grande diversité de<br />
microorganismes dont une grande partie est totalement inconnue<br />
Ces systèmes ne sont pas stables: des divisions entières de bactéries peuvent apparaitre<br />
puis disparaitre (sans doute suite à l’action de phages) et sans que le fonctionnement général<br />
ne semble être modifié<br />
Les banques "grand insert" sont utiles pour identifier des ADNr 16S "exotiques"<br />
De nouvelles divisions bactériennes peuvent être découvertes et caractérisées par des<br />
approches métagénomiques<br />
Il n’est pas impossible de reconstituer le génome complet de bactéries appartenant à des<br />
divisions sans représentant cultivable, même à partir d’un métagénome complexe<br />
Les banques "grand insert" sont très utiles pour les études fonctionnelles<br />
Les séquences métagénomiques permettent la mise en évidence de nouvelles enzymes et<br />
de voies métaboliques alternatives<br />
La capture de séquence peut être un atout pour étendre des gènes incomplets,<br />
relier des contigs entre eux et pour le finishing (génomes complexes, eucaryotes)
Merci pour votre attention
Nicholson & Lindon, Nature, 2008
This urine wheel was<br />
published in 1506 by<br />
Ullrich Pinder, in his book<br />
Epiphanie Medicorum.<br />
It describes the possible colours, smells and tastes of urine, and uses them to diagnose disease.