Denis LE PASLIER - CNRS

Bouche d’égout de la Cloaca maxima 

se jetant dans le Tibre 

Si la légende dit que lorsque l’on met la main dans la Bouche de la Vérité, on ne peut l’en 

ressortir que si l’on n’a jamais menti… 

Il en est fait une fonction beaucoup plus terre à terre qui lui fut assignée par le passé: celle d’une 

bouche d’égout de la Cloaca maxima ̏ le très grand égout˝ construit pour assécher la vallée du 

Forum Romain, dont la construction a été entreprise par Tarquin l’Ancien (Lucius Tarquinius 

Priscus, 5 ème Roi de Rome, 534 à 509 av. J-C.)

Cloaca maxima 

rencontre entre les anciens et les modernes 

Denis Le Paslier 

Ecole Thématique Expert Génomique Environnementale (ETEGE) 

23 - 27 Avril 2012, Aussois

Depuis les Romains le traitement des eaux a évolué…

Traitements 

primaires 

eau 

ésiduaire 

Décanteur 

primaire 

Principe de l’épuration 

Traitement des eaux 

Bassins 

biologiques 

Recirculation 

Traitement des boues 

digestion anaérobie 

Clarificateur 

secondaire 

Extraction 

des boues en excès 

eau traitée 

boues traitées

Flottateur 

Décanteur 

primaire 

Bassin 

d'anoxie Bassin aérobie 

Digesteur

Inventaire des microorganismes 

Inventaire des gènes 

Objectifs 

Inventaire des activités enzymatiques 

Quels sont les processus métaboliques impliqués dans le traitement des eaux, 

avec un intérêt particulier pour la digestion anaérobie

Un inventaire moléculaire a été réalisé par l’approche classique de 

clonage et séquençage de produits PCR ciblant l’ADNr 16S : 

trois principaux bassins : aérobie 

anoxie 

digesteur anaérobie mésophile 

avec amorces spécifiques : Archaea, Bacteria, Planctomycetales, 

Acidobacteria, Verrucomicrobia, WS6, BRC1 

une grande diversité d’Archaea et Bacteries 

nouvelles lignées phylogénétiques et 

nouvelles divisions candidates bactériennes 

Chouari et al., Microb. Ecol. 2010 

Chouari et al., Environ. Microbiol. 2005 

Chouari et al., Appl. Environ. Microbiol. 2005 

Chouari et al., Appl. Environ. Microbiol. 2003

Bassin aérobie 

BACs 

> 564 000 clones -> 330 K lectures 

taille moyenne 60 kb 

Digesteur anaérobie mésophile 

Fosmides 

1 M clones -> 1,8 M lectures 

plasmides 3kb -> 1 M lectures

5 

4 

3 

2 

1 

0 

0 10 20 30 40 50 60 70 80 90 100 

G + C % distribution 

FES 

PES 

GS-FLX 

454

Hypothèse : existe-t-il d’autres divisions bactériennes inconnues? 

Hybridations 

Sondes oligonucléotidiques (ex: Eub338 I, II, III …) 

Sondes complexes (ADNr 16S à partir de pools de produits PCR 

représentatifs des différentes divisions bactériennes 

(Archaea, Planctomycetales, OP11, WS6 etc …) 

Digesteur anaérobie 1 membrane (27 648 Fosmides) 

599 fosmides 

séquençage direct à partir de 4 amorces 

8 330 1100 1517

40 

35 

30 

25 

20 

15 

10 

5 

0 

16S rRNA gene distribution 

Archara + 40 divisions bactériennes 

%FES 

%PES 

%FOS 

%FLX 

r454%

Découverte d’une nouvelle division bactérienne : WWE3 

Séquençage ADNr 16S (avec amorces universelles) ne donne rien sur 30 fosmides 

Séquençage d’un de ces fosmides : contient un ADNr 16S (et 23S) 

Cet ADNr 16S ne peut être amplifié ni séquencé par amorces universelles car Il y a au moins deux 

mis-appariements avec ces amorces 

Ces 30 fosmides ont la même séquence d’ADNr 16S 

WWE3 représente 5% des fosmides (5% des bactéries?) 

Une seule séquence similaire dans les bases de données (88% d’identité) 

Amorces spécifiques pour PCR et FISH : détecté dans 20 / 48 digesteurs testés

40 

35 

30 

25 

20 

15 

10 

5 

0 

%FES 

%PES 

%FOS 

%FLX 

r454%

WWE1: une nouvelle division candidate bactérienne 

10% des ADNr 16S 

séquençage de fosmides "16S" 

recherche de séquences 

d’extrémité de fosmides 

chevauchantes 

(Blastn2, RI 99% & RZ 0,9) 

couverture homogène et élevée 

(10 à 15 X) 

Il devrait être possible d’assembler 

de grands fragments de génome 

d’un représentant de cette 

division candidate

Assemblage itératif 

(. . .) 

≥ 99% identité & ≥ 90% longueur lecture 

1. ancrage : fosmide 

2. lectures ancres 

3. lectures opposées 

4. assemblage 

5. sélection des contigs 

6. itérations...

"Candidatus Cloacamonas aminacidovorans" (2,2% des FES) 

a disparu du digesteur d’Evry depuis la construction de la banque de fosmides 

Mais a réapparu et disparu plusieurs fois depuis 

Cloacamonas a été détecté par PCR dans 13 / 43 digesteurs anaérobies testés 

(Amérique, Europe) et d’autres représentants de la division candidate WWE1 dans 32 

/ 43 

A été maintenu en culture pendant plus de 2 ans, mais toujours en très faible quantité

lectures 

Assemblage 

taille 

moyenne 

(pb) 

N 

lectures 

% 

assemblées 

Fosmides 40 kb FES 645 1,8E+06 48 

pCNS 3 kb PES 662 1,0E+06 47 

454 FLX 231 3,4E+05 26 

contigs supercontigs 

Nombre 7495 2827 

total Mb 75 102 

taille moyenne (kb) 10 36 

plus grand (kb) 894 5705 

30 supercontigs plus grands que 500 kb

Digesteur anaérobie Evry 

Library sequence # reads average in assembly fraction assembled 

size bp RI>=99 & RZ >= 0,9 Arachne 

Fosmid FES 1,7 M 645.3 40.1% 47.6 

Plasmid PES 1 M 665.6 41.7% 46.8 

GS-FLX 342 K 231.5 11.5% 26.2 

7495 contigs organisés en 2827 scaffolds (75 Mb total) 

40 -50 % FES dans assemblage Arachne 

Sondes choisies 50% FES dans assemblage Arachne

SC_Id Mb GC% Organism 

0 5,7 0,62 Methanomicrobiales xxx Archaea 

1 4,6 0,49 Bacteroidetes xxx 16S rDNA 

2 3,7 0,64 Betaproteobacteria xxx protéines ribosomales 

3 3,0 0,62 Verruvomicrobiales inconnus 

4 2,8 0,40 Bacteroidetes 

5 2,8 0,52 Methanosarcinales 

6 2,2 0,38 Cloacamonas 

7 2,2 0,66 Actinobacteria 

8 2,1 0,66 Actinobacteria 

9 2,2 0,56 Deltaproteobacteria 

10 1,9 0,57 Synergistetes 

11 2,0 0,58 Methanomicrobiales 

12 1,6 0,55 Deltaproteobacteria 

13 1,1 0,55 

14 1,7 0,42 Methanomicrobiales 

15 1,3 0,40 WWE1 

16 0,9 0,57 

17 0,7 0,39 OD1 

18 0,7 0,35 WWE3 

19 0,9 0,49 

20 0,6 0,35 WS6 

21 0,6 0,47 

22 0,5 0,49 

23 0,6 0,40 ZB2 

25 0,5 0,35 

26 0,7 0,50 Betaproteobacteria 

28 0,6 0,58 

33 0,6 0,44 

36 0,7 0,56 

41 0,6 0,48 

4 Archaea 

6 divisions candidates 

10 affiliation inconnue ! 

Annotation MaGe

8 scaff

Sequence capture : un outil pour la métagénomique ?

Un des problèmes majeurs en génétique humaine : le séquençage de nombreux génomes 

Coût du séquençage en baisse 

Projet 1000 génomes etc. 

1000 US$ 

Première approche : séquençage exome (30 Mb, 85% mutations responsables maladies génétiques) 

Stratégie développée par Roche Nimblegen: Direct Genomic Selection (DGS) 

the Sequence Capture Human Exome 2.1M Array to capture ~ 180,000 coding exons 

=> Application à la métagénomique ex: MetaHit 3,9 M génes = 1,5 M incomplets 

qques ref: 

Basiardes S et al., (2005) Direct Genomic Selection. Nature Methods 1, 63-69. 

Kahvejian A et al., (2008) What would you do if you could sequence everything? Nature Biotechnology 26, 1125 - 1133. 

Mamanova et al., (2010) Target-enrichment strategies for nextgeneration sequencing, Nature methods 2010 

Feb;7(2):111-8 

Biesecker L. (2010) Exome sequencing makes medical genomics a reality. Nature Genetics. 42:13-14.

ADN 

18 mars 2002, fosmides, plasmides, GS-FLX 

3 µg, shearing, 500 pb sizing 

+ adaptors Titanium 

amplification (10x) durant séquençage Titanium ou Illumina 

Sondes 

contigs (gènes incomplets) 10 K 

FES 2,4 M 

Enlever redondance etc. 6 M sondes 

2,1 M spots 

50 – 98 bases 70 moyenne

#reads 

GC% 

FES 

capture

FES # Hits 

Phage terminase 11601 

Phage terminase, large subunit 6699 

decarboxylase 6107 

Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 4988 

Glycosyltransferase 4212 

GTP-binding protein 3729 

Phage terminase large subunit 3622 

Integrase 3415 

Phage protein 3079 

Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 2400 

Capture 

decarboxylase 1028 

Long-chain-fatty-acid--CoA ligase (EC 6.2.1.3) 925 

GTP-binding protein 848 

Translation elongation factor G 598 

Excinuclease ABC subunit A 585 

Glycosyltransferase 564 

DNA-directed RNA polymerase beta' subunit (EC 2.7.7.6) 528 

Type I restriction-modification system, restriction subunit R (EC 3.1.21.3) 499 

DNA-directed RNA polymerase beta subunit (EC 2.7.7.6) 492 

Copper-translocating P-type ATPase (EC 3.6.3.4) 459 

Top 10 subsystems (élimination de la redondance lors du choix des sondes) MG-RAST

G + C % similaire mais différences 

Redondance peu de séquences identiques OK 

Elimination "repeats" (sondes) OK 

Scaffolding > 150 contigs reliés par captures OK 

Séquences nouvelles # 15% OK 

Assemblage 90% captures dans assemblage OK 

Incomplets + sondes + captures 

25 Mb nouveaux contigs OK

Digesteur anaérobie Evry 

Library sequence # reads average in assembly fraction assembled 

size bp RI>=99 & RZ >= 0,9 Arachne 

Fosmid FES 1,7 M 645.3 40.1% 47.6 

Plasmid PES 1 M 665.6 41.7% 46.8 

GS-FLX 342 K 231.5 11.5% 26.2 

7495 contigs organisés en 2827 scaffolds (75 Mb total) 

40 -50 % FES dans assemblage Arachne 

Sondes choisies 50% FES dans assemblage Arachne

Conclusions 

Les stations d’épurations des eaux usées hébergent une grande diversité de 

microorganismes dont une grande partie est totalement inconnue 

Ces systèmes ne sont pas stables: des divisions entières de bactéries peuvent apparaitre 

puis disparaitre (sans doute suite à l’action de phages) et sans que le fonctionnement général 

ne semble être modifié 

Les banques "grand insert" sont utiles pour identifier des ADNr 16S "exotiques" 

De nouvelles divisions bactériennes peuvent être découvertes et caractérisées par des 

approches métagénomiques 

Il n’est pas impossible de reconstituer le génome complet de bactéries appartenant à des 

divisions sans représentant cultivable, même à partir d’un métagénome complexe 

Les banques "grand insert" sont très utiles pour les études fonctionnelles 

Les séquences métagénomiques permettent la mise en évidence de nouvelles enzymes et 

de voies métaboliques alternatives 

La capture de séquence peut être un atout pour étendre des gènes incomplets, 

relier des contigs entre eux et pour le finishing (génomes complexes, eucaryotes)

Merci pour votre attention

Nicholson & Lindon, Nature, 2008

This urine wheel was 

published in 1506 by 

Ullrich Pinder, in his book 

Epiphanie Medicorum. 

It describes the possible colours, smells and tastes of urine, and uses them to diagnose disease.

Denis LE PASLIER - CNRS

Create successful ePaper yourself

Delete template?

Save as template?