03.07.2013 Views

Denis LE PASLIER - CNRS

Denis LE PASLIER - CNRS

Denis LE PASLIER - CNRS

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Bouche d’égout de la Cloaca maxima<br />

se jetant dans le Tibre<br />

Si la légende dit que lorsque l’on met la main dans la Bouche de la Vérité, on ne peut l’en<br />

ressortir que si l’on n’a jamais menti…<br />

Il en est fait une fonction beaucoup plus terre à terre qui lui fut assignée par le passé: celle d’une<br />

bouche d’égout de la Cloaca maxima ̏ le très grand égout˝ construit pour assécher la vallée du<br />

Forum Romain, dont la construction a été entreprise par Tarquin l’Ancien (Lucius Tarquinius<br />

Priscus, 5 ème Roi de Rome, 534 à 509 av. J-C.)


Cloaca maxima<br />

rencontre entre les anciens et les modernes<br />

<strong>Denis</strong> Le Paslier<br />

Ecole Thématique Expert Génomique Environnementale (ETEGE)<br />

23 - 27 Avril 2012, Aussois


Depuis les Romains le traitement des eaux a évolué…


Traitements<br />

primaires<br />

eau<br />

ésiduaire<br />

Décanteur<br />

primaire<br />

Principe de l’épuration<br />

Traitement des eaux<br />

Bassins<br />

biologiques<br />

Recirculation<br />

Traitement des boues<br />

digestion anaérobie<br />

Clarificateur<br />

secondaire<br />

Extraction<br />

des boues en excès<br />

eau traitée<br />

boues traitées


Flottateur<br />

Décanteur<br />

primaire<br />

Bassin<br />

d'anoxie Bassin aérobie<br />

Digesteur


Inventaire des microorganismes<br />

Inventaire des gènes<br />

Objectifs<br />

Inventaire des activités enzymatiques<br />

Quels sont les processus métaboliques impliqués dans le traitement des eaux,<br />

avec un intérêt particulier pour la digestion anaérobie


Un inventaire moléculaire a été réalisé par l’approche classique de<br />

clonage et séquençage de produits PCR ciblant l’ADNr 16S :<br />

trois principaux bassins : aérobie<br />

anoxie<br />

digesteur anaérobie mésophile<br />

avec amorces spécifiques : Archaea, Bacteria, Planctomycetales,<br />

Acidobacteria, Verrucomicrobia, WS6, BRC1<br />

une grande diversité d’Archaea et Bacteries<br />

nouvelles lignées phylogénétiques et<br />

nouvelles divisions candidates bactériennes<br />

Chouari et al., Microb. Ecol. 2010<br />

Chouari et al., Environ. Microbiol. 2005<br />

Chouari et al., Appl. Environ. Microbiol. 2005<br />

Chouari et al., Appl. Environ. Microbiol. 2003


Bassin aérobie<br />

BACs<br />

> 564 000 clones -> 330 K lectures<br />

taille moyenne 60 kb<br />

Digesteur anaérobie mésophile<br />

Fosmides<br />

1 M clones -> 1,8 M lectures<br />

plasmides 3kb -> 1 M lectures


5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

0 10 20 30 40 50 60 70 80 90 100<br />

G + C % distribution<br />

FES<br />

PES<br />

GS-FLX<br />

454


Hypothèse : existe-t-il d’autres divisions bactériennes inconnues?<br />

Hybridations<br />

Sondes oligonucléotidiques (ex: Eub338 I, II, III …)<br />

Sondes complexes (ADNr 16S à partir de pools de produits PCR<br />

représentatifs des différentes divisions bactériennes<br />

(Archaea, Planctomycetales, OP11, WS6 etc …)<br />

Digesteur anaérobie 1 membrane (27 648 Fosmides)<br />

599 fosmides<br />

séquençage direct à partir de 4 amorces<br />

8 330 1100 1517


40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

16S rRNA gene distribution<br />

Archara + 40 divisions bactériennes<br />

%FES<br />

%PES<br />

%FOS<br />

%FLX<br />

r454%


Découverte d’une nouvelle division bactérienne : WWE3<br />

Séquençage ADNr 16S (avec amorces universelles) ne donne rien sur 30 fosmides<br />

Séquençage d’un de ces fosmides : contient un ADNr 16S (et 23S)<br />

Cet ADNr 16S ne peut être amplifié ni séquencé par amorces universelles car Il y a au moins deux<br />

mis-appariements avec ces amorces<br />

Ces 30 fosmides ont la même séquence d’ADNr 16S<br />

WWE3 représente 5% des fosmides (5% des bactéries?)<br />

Une seule séquence similaire dans les bases de données (88% d’identité)<br />

Amorces spécifiques pour PCR et FISH : détecté dans 20 / 48 digesteurs testés


40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

%FES<br />

%PES<br />

%FOS<br />

%FLX<br />

r454%


WWE1: une nouvelle division candidate bactérienne<br />

10% des ADNr 16S<br />

séquençage de fosmides "16S"<br />

recherche de séquences<br />

d’extrémité de fosmides<br />

chevauchantes<br />

(Blastn2, RI 99% & RZ 0,9)<br />

couverture homogène et élevée<br />

(10 à 15 X)<br />

Il devrait être possible d’assembler<br />

de grands fragments de génome<br />

d’un représentant de cette<br />

division candidate


Assemblage itératif<br />

(. . .)<br />

≥ 99% identité & ≥ 90% longueur lecture<br />

1. ancrage : fosmide<br />

2. lectures ancres<br />

3. lectures opposées<br />

4. assemblage<br />

5. sélection des contigs<br />

6. itérations...


"Candidatus Cloacamonas aminacidovorans" (2,2% des FES)<br />

a disparu du digesteur d’Evry depuis la construction de la banque de fosmides<br />

Mais a réapparu et disparu plusieurs fois depuis<br />

Cloacamonas a été détecté par PCR dans 13 / 43 digesteurs anaérobies testés<br />

(Amérique, Europe) et d’autres représentants de la division candidate WWE1 dans 32<br />

/ 43<br />

A été maintenu en culture pendant plus de 2 ans, mais toujours en très faible quantité


lectures<br />

Assemblage<br />

taille<br />

moyenne<br />

(pb)<br />

N<br />

lectures<br />

%<br />

assemblées<br />

Fosmides 40 kb FES 645 1,8E+06 48<br />

pCNS 3 kb PES 662 1,0E+06 47<br />

454 FLX 231 3,4E+05 26<br />

contigs supercontigs<br />

Nombre 7495 2827<br />

total Mb 75 102<br />

taille moyenne (kb) 10 36<br />

plus grand (kb) 894 5705<br />

30 supercontigs plus grands que 500 kb


Digesteur anaérobie Evry<br />

Library sequence # reads average in assembly fraction assembled<br />

size bp RI>=99 & RZ >= 0,9 Arachne<br />

Fosmid FES 1,7 M 645.3 40.1% 47.6<br />

Plasmid PES 1 M 665.6 41.7% 46.8<br />

GS-FLX 342 K 231.5 11.5% 26.2<br />

7495 contigs organisés en 2827 scaffolds (75 Mb total)<br />

40 -50 % FES dans assemblage Arachne<br />

Sondes choisies 50% FES dans assemblage Arachne


SC_Id Mb GC% Organism<br />

0 5,7 0,62 Methanomicrobiales xxx Archaea<br />

1 4,6 0,49 Bacteroidetes xxx 16S rDNA<br />

2 3,7 0,64 Betaproteobacteria xxx protéines ribosomales<br />

3 3,0 0,62 Verruvomicrobiales inconnus<br />

4 2,8 0,40 Bacteroidetes<br />

5 2,8 0,52 Methanosarcinales<br />

6 2,2 0,38 Cloacamonas<br />

7 2,2 0,66 Actinobacteria<br />

8 2,1 0,66 Actinobacteria<br />

9 2,2 0,56 Deltaproteobacteria<br />

10 1,9 0,57 Synergistetes<br />

11 2,0 0,58 Methanomicrobiales<br />

12 1,6 0,55 Deltaproteobacteria<br />

13 1,1 0,55<br />

14 1,7 0,42 Methanomicrobiales<br />

15 1,3 0,40 WWE1<br />

16 0,9 0,57<br />

17 0,7 0,39 OD1<br />

18 0,7 0,35 WWE3<br />

19 0,9 0,49<br />

20 0,6 0,35 WS6<br />

21 0,6 0,47<br />

22 0,5 0,49<br />

23 0,6 0,40 ZB2<br />

25 0,5 0,35<br />

26 0,7 0,50 Betaproteobacteria<br />

28 0,6 0,58<br />

33 0,6 0,44<br />

36 0,7 0,56<br />

41 0,6 0,48<br />

4 Archaea<br />

6 divisions candidates<br />

10 affiliation inconnue !<br />

Annotation MaGe


8 scaff


Sequence capture : un outil pour la métagénomique ?


Un des problèmes majeurs en génétique humaine : le séquençage de nombreux génomes<br />

Coût du séquençage en baisse<br />

Projet 1000 génomes etc.<br />

1000 US$<br />

Première approche : séquençage exome (30 Mb, 85% mutations responsables maladies génétiques)<br />

Stratégie développée par Roche Nimblegen: Direct Genomic Selection (DGS)<br />

the Sequence Capture Human Exome 2.1M Array to capture ~ 180,000 coding exons<br />

=> Application à la métagénomique ex: MetaHit 3,9 M génes = 1,5 M incomplets<br />

qques ref:<br />

Basiardes S et al., (2005) Direct Genomic Selection. Nature Methods 1, 63-69.<br />

Kahvejian A et al., (2008) What would you do if you could sequence everything? Nature Biotechnology 26, 1125 - 1133.<br />

Mamanova et al., (2010) Target-enrichment strategies for nextgeneration sequencing, Nature methods 2010<br />

Feb;7(2):111-8<br />

Biesecker L. (2010) Exome sequencing makes medical genomics a reality. Nature Genetics. 42:13-14.


ADN<br />

18 mars 2002, fosmides, plasmides, GS-FLX<br />

3 µg, shearing, 500 pb sizing<br />

+ adaptors Titanium<br />

amplification (10x) durant séquençage Titanium ou Illumina<br />

Sondes<br />

contigs (gènes incomplets) 10 K<br />

FES 2,4 M<br />

Enlever redondance etc. 6 M sondes<br />

2,1 M spots<br />

50 – 98 bases 70 moyenne


#reads<br />

GC%<br />

FES<br />

capture


FES # Hits<br />

Phage terminase 11601<br />

Phage terminase, large subunit 6699<br />

decarboxylase 6107<br />

Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 4988<br />

Glycosyltransferase 4212<br />

GTP-binding protein 3729<br />

Phage terminase large subunit 3622<br />

Integrase 3415<br />

Phage protein 3079<br />

Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 2400<br />

Capture<br />

decarboxylase 1028<br />

Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 925<br />

GTP-binding protein 848<br />

Translation elongation factor G 598<br />

Excinuclease ABC subunit A 585<br />

Glycosyltransferase 564<br />

DNA-directed RNA polymerase beta' subunit (EC 2.7.7.6) 528<br />

Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 499<br />

DNA-directed RNA polymerase beta subunit (EC 2.7.7.6) 492<br />

Copper-translocating P-type ATPase (EC 3.6.3.4) 459<br />

Top 10 subsystems (élimination de la redondance lors du choix des sondes) MG-RAST


G + C % similaire mais différences<br />

Redondance peu de séquences identiques OK<br />

Elimination "repeats" (sondes) OK<br />

Scaffolding > 150 contigs reliés par captures OK<br />

Séquences nouvelles # 15% OK<br />

Assemblage 90% captures dans assemblage OK<br />

Incomplets + sondes + captures<br />

25 Mb nouveaux contigs OK


Digesteur anaérobie Evry<br />

Library sequence # reads average in assembly fraction assembled<br />

size bp RI>=99 & RZ >= 0,9 Arachne<br />

Fosmid FES 1,7 M 645.3 40.1% 47.6<br />

Plasmid PES 1 M 665.6 41.7% 46.8<br />

GS-FLX 342 K 231.5 11.5% 26.2<br />

7495 contigs organisés en 2827 scaffolds (75 Mb total)<br />

40 -50 % FES dans assemblage Arachne<br />

Sondes choisies 50% FES dans assemblage Arachne


Conclusions<br />

Les stations d’épurations des eaux usées hébergent une grande diversité de<br />

microorganismes dont une grande partie est totalement inconnue<br />

Ces systèmes ne sont pas stables: des divisions entières de bactéries peuvent apparaitre<br />

puis disparaitre (sans doute suite à l’action de phages) et sans que le fonctionnement général<br />

ne semble être modifié<br />

Les banques "grand insert" sont utiles pour identifier des ADNr 16S "exotiques"<br />

De nouvelles divisions bactériennes peuvent être découvertes et caractérisées par des<br />

approches métagénomiques<br />

Il n’est pas impossible de reconstituer le génome complet de bactéries appartenant à des<br />

divisions sans représentant cultivable, même à partir d’un métagénome complexe<br />

Les banques "grand insert" sont très utiles pour les études fonctionnelles<br />

Les séquences métagénomiques permettent la mise en évidence de nouvelles enzymes et<br />

de voies métaboliques alternatives<br />

La capture de séquence peut être un atout pour étendre des gènes incomplets,<br />

relier des contigs entre eux et pour le finishing (génomes complexes, eucaryotes)


Merci pour votre attention


Nicholson & Lindon, Nature, 2008


This urine wheel was<br />

published in 1506 by<br />

Ullrich Pinder, in his book<br />

Epiphanie Medicorum.<br />

It describes the possible colours, smells and tastes of urine, and uses them to diagnose disease.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!