Sébastien TERRAT - CNRS
Sébastien TERRAT - CNRS
Sébastien TERRAT - CNRS
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Apport des nouvelles générations de<br />
séquençage pour accéder à la diversité et<br />
la richesse des communautés microbiennes<br />
de sols issus d'échantillonnage de grande<br />
ampleur<br />
S. Terrat 1 , S. Dequiedt 1 , R. Christen 3 , D. Bachar 3 , M. Lelièvre 1 , T. Regnier 2 , V. Nowak 2 , P. Plassart 2 ,<br />
P. Wincker 4 , P. Lemanceau 2 , P.A. Maron 1,2 , C. Mougel 1,2 et L. Ranjard 1,2<br />
1 – UMR Agroécologie 1347 – Plateforme GenoSol, INRA – Dijon<br />
2 – UMR Agroécologie 1347 – Pôle EcolDur, INRA – Dijon<br />
3 – UMR <strong>CNRS</strong> 6543 – Laboratoire de Biologie Virtuelle, Nice<br />
4 – CEA, Institut de Génomique (IG), Genoscope, Evry.
Caractéristiques des sols<br />
Le sol est un environnement naturel assurant de multiples fonctions<br />
Production d’aliments et<br />
de biomasse<br />
Source : A. Richer de Forges (CA 45)<br />
Source : Infosol (INRA Orléans)<br />
Source de matières<br />
premières<br />
Source : J. Moulin (CA 36)<br />
Habitat et patrimoine<br />
génétique<br />
Source : Infosol (INRA Orléans)<br />
Les microorganismes des sols sont très abondants, avec une forte<br />
diversité<br />
1g de sol<br />
Bactéries<br />
Champignons<br />
10 6 - 10 9 individus<br />
10 3 - 10 6 individus<br />
10 3 - 10 6 espèces<br />
Variable
Objectifs<br />
Caractérisation des communautés microbiennes des sols via l’exploitation des<br />
données issues du pyroséquençage d’amplicons 16S et 18S.<br />
Inventaire exhaustif de la diversité microbienne tellurique,<br />
Evaluer sa distribution temporelle et spatiale,<br />
Mieux comprendre la régulation des communautés microbiennes du sol,<br />
Relier cette diversité en fonctionnement biologique du sol et en services<br />
écosystémiques.<br />
(Ranjard et al., 2003, Ranjard et al., 2009, Dequiedt et al. 2011)
Inventaire de la diversité microbienne à l’échelle de la France<br />
RMQS : Réseau de Mesure de la Qualité des Sols, mis en place en 2002 (INRA INFOSOL,<br />
Orléans), grille d’échantillonnage des sols français : 16 km x 16km sur toute la France<br />
2206 points.<br />
ICP Forest niveau 1<br />
1/3 sites agricoles<br />
1/3 sites forestiers<br />
1/3 sites prairies<br />
Cartographie de la qualité des sols basée uniquement sur les paramètres physico-chimiques :<br />
- texture, pH, Corg tot, Norg, Ca, Na, Mg, ETM, …
DNA<br />
1<br />
Métagenome<br />
Abondance<br />
Diversité<br />
L’écologie moléculaire microbienne<br />
RNA<br />
2<br />
Métatranscriptome<br />
Fonctionnalité<br />
Protein<br />
3<br />
Métaproteome<br />
MétaTaxogénomique (16S/18S)<br />
Substrats<br />
Produits<br />
4<br />
Métabolome<br />
Activité<br />
Services<br />
(Maron et al. 2007)
Le pyroséquençage<br />
L’expansion des nouvelles générations de séquençage permet<br />
maintenant d’acquérir un grand nombre de séquences.<br />
GS-FLX 454 (Roche) Titanium :<br />
• 1,000,000 reads (~400 bases)<br />
• 400,000,000 bases en 10 heures<br />
Limitation : production massive de données à traiter et à gérer.<br />
Nécessité d’utiliser un pipeline d’analyse bioinformatique<br />
optimisé et répondant à nos besoins.
Pipelines bioinformatique existants<br />
PLUS MOINS<br />
▲ Multiplateformes,<br />
▲ MAJ (V 1.24.1),<br />
▲ Nombreux outils dispo,<br />
▲ Communauté active.<br />
▲ Pas d’installation,<br />
▲ Interface web conviviale,<br />
▲ Outil de référence.<br />
▲ MAJ (V 1.4.0),<br />
▲ Analyse rapide,<br />
▲ Production de<br />
graphiques de qualité.<br />
Développement pipeline dédié (16S/18S)<br />
▼ Lignes de commande,<br />
▼ Difficultés sur gros jeux<br />
de données,<br />
▼ Complexe à paramétrer.<br />
▼ Volume des données,<br />
▼ Peu évolutif,<br />
▼ Téléchargements<br />
fichiers à chaque étape.<br />
▼ Confidentialité données.<br />
▼ Linux ou Mac OS,<br />
▼ Lignes de commande,<br />
▼ Certains outils intégrés<br />
engendreraient des<br />
erreurs.<br />
(Schloss, 2010 – Barriuso et al., 2011 – White et al., 2010)
Raw reads<br />
(454, Illumina,<br />
etc…)<br />
Pipeline bioinformatique de traitement : vue globale<br />
Prétraitement<br />
Harmonisation<br />
Taxonomie<br />
Analyses<br />
CLUSTERING 3.0% (INDICES DE DIVERSITE)<br />
Sample Nb_seqs Nb_clusters Shannon var(Shannon) Evenness Simpson 1/Simpson<br />
Zone A 1770 62 1.91 0.00139537 0.462716 0.25854 3.868<br />
Zone A 2739 100 2.242 0.00104185 0.486905 0.206566 4.841<br />
Témoin Zone B 5163 76 1.37 0.000603875 0.316427 0.496192 2.015<br />
Zone B 20159 310 3.235 0.000142737 0.563985 0.0867775 11.524<br />
Zone B 10274 183 2.489 0.00037131 0.477824 0.231748 4.315<br />
Alignement<br />
Données exploitables<br />
Clustering Filtres<br />
Statistiques
Séquences<br />
brutes<br />
Clustering basé sur l’alignement multiple INFERNAL<br />
Clustering des données à K différences (PERL).<br />
S’appuie sur des données organisées (diminution nombre d’étapes).<br />
S’appuie sur les séquences les plus « vraies ».<br />
Calcul de similarité entre 2 séquences (distance d’édition de Levenshtein).<br />
Ignore les erreurs d’homopolymères.<br />
(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />
Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques
Séquences<br />
brutes<br />
Filtre des reads<br />
Limitations :<br />
Peu de recul sur taux d’erreur lié au pyroséquençage,<br />
Existence des chimères, des single-singletons.<br />
Clustering<br />
(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />
Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques
Séquences<br />
brutes<br />
Filtre des reads<br />
(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />
Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques
Séquences<br />
brutes<br />
Filtre des reads<br />
Elimination des single-singletons<br />
Assignation<br />
taxonomique<br />
Si OK : réinjection,<br />
Sinon : élimination.<br />
Elimination suffisante, trop stringente ?<br />
Filtre supplémentaire pour chimères ?<br />
(Terrat et al., 2012 - Shahbazkia & Christen, in preparation)<br />
Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques
Séquences<br />
brutes<br />
Assignation taxonomique<br />
Limitations :<br />
Peu de recul sur qualité des bases disponibles,<br />
Approches d’assignation différentes.<br />
16S 18S<br />
RDP<br />
multiclassifier BLAST<br />
???<br />
BLAST<br />
Couplage<br />
résultats<br />
Autres bases ?<br />
Autres approches ?<br />
Prétraitement Alignement Clustering Filtres Taxonomie Analyses Statistiques<br />
???<br />
Couplage<br />
résultats
Développements techniques en cours<br />
Mise au point d’une interface graphique multiplateforme :<br />
• Interface graphique conviviale en cours de développement pour interagir<br />
avec serveur de calcul dédié.<br />
Développement d’une interface Web :<br />
• Interface Web pour accéder au pipeline développé par la plateforme<br />
GenoSol et pour nos différents collaborateurs.
Assignation taxonomique :<br />
• Mise au point de bases épurées et d’une nouvelle approche<br />
d’assignation appelée AffilGood.<br />
Optimisation du pipeline :<br />
Développements techniques en cours<br />
Collaboration avec P. PEYRET et E. PEYRETAILLADE<br />
Université d’Auvergne (ERT-CIDAM)<br />
• Collaboration sur l’analyse de données et la mise au point ou<br />
l’amélioration de programmes intégrés au pipeline.<br />
Collaboration avec R. CHRISTEN<br />
UMR <strong>CNRS</strong> 6543 – Laboratoire de Biologie Virtuelle
Influence des procédures d’extraction (standardisation) :<br />
1 er paramètre à prendre en compte dans les inventaires taxonomiques<br />
de la microflore tellurique.<br />
Abondance relative (%)<br />
MOBIO<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
0 1 2 3 4 5<br />
GnS-GII<br />
Développements techniques en cours<br />
Partenariat scientifique avec P. WINCKER (initiation projet Taxomic-RMQS)<br />
Institut de Génomique – Centre National de Séquençage – Genoscope<br />
(A) 5 (B)<br />
SY3<br />
Abondance relative (%)<br />
4<br />
3<br />
2<br />
1<br />
0<br />
0 1 2 3 4 5<br />
GnS-GII<br />
Gemmatimonadetes<br />
Nitrospira<br />
Crenarchaeota<br />
Firmicutes<br />
TM7<br />
WS3<br />
OP10<br />
Sols sous culture : ; forêt à feuilles<br />
caduques : ; forêt de conifères : ;<br />
prairies : et vignes : . (A)<br />
Comparaison de GnS-GII avec MOBIO,<br />
et (B) de GnS-GII avec SY3.<br />
(Terrat et al., 2012)
Lionel Ranjard<br />
Remerciements<br />
Pierre-Alain Maron<br />
Christophe Mougel<br />
Samuel Dequiedt<br />
Mélanie Lelièvre<br />
Fabien Morin<br />
Philippe Lemanceau<br />
Richard Christen Patrick Wincker
Merci de votre attention !
INRA de Dijon – UMR Agroécologie<br />
Equipe rattachée au pôle EcolDur<br />
Axe 1 : Distribution spatiale (temporelle) et régulation de la diversité<br />
microbienne des sols<br />
Axe 2 : Traduction de la diversité microbienne en fonctionnement<br />
biologique (turnover des matières organiques des sols – cycle du C)<br />
Carte de diversité<br />
microbienne des<br />
sols<br />
Traduction<br />
Carte d’aptitude<br />
des sols à stocker<br />
et déstocker du<br />
Carbone<br />
Programme Carbomic-RMQS
Appui logistique<br />
Centre de Ressources Génétiques :<br />
conservatoire de sols et ADNs de sites expérimentaux,<br />
réseaux de surveillance et observatoire (RMQS, OREs, Réseau<br />
PIC, Sites ateliers, sites de l’ADEME, ANDRA, OSV, LTO européens,…)<br />
Plateforme Technique : caractérisation de la<br />
diversité microbienne (qPCR, Fingerprint, Metaprotéomique,<br />
Pyroséquençage,…)<br />
Système d’Information Environnementale<br />
(S.I.E.) : base de données (gestion et traçabilité, confrontation<br />
données environnementales - microbiennes…) et outils<br />
mathématiques adéquats (statistiques, géostatistiques, pipeline<br />
bioinformatique,…)<br />
Démarche qualité, veille technologique et formation<br />
Mise à la disposition de la communauté scientifique<br />
Référentiel de la caractérisation microbienne des sols
Diagramme Organisationnel de GenoSol