13.07.2015 Views

Marie-Christine LE PASLIER - Inra

Marie-Christine LE PASLIER - Inra

Marie-Christine LE PASLIER - Inra

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Revue des méthodesde génotypage et de séquençageMonastir, 10-12 octobre 2011Aurélie BERARD & <strong>Marie</strong>-<strong>Christine</strong> <strong>LE</strong> <strong>PASLIER</strong> – INRA EPGV, EvrySandra GUILLOUD, Véronique GAUTIER, Charles PONCET – INRA GDEC, Clermont-FerrandPierre MOURNET – CIRAD, MontpellierPlate-forme de Génotypage et Séquençage GENTYANEUMR1095 INRA – UBP “Génétique, Diversité & Ecophysiologie des Céréales”E P G VEtude du Polymorphisme des Génomes VégétauxUnité 1279_DGAP1IG


Number of individualsTechnologies de génotypage & séquençage 201110000400030002000100010010 100 1000 10,000 100,000 1,000,000Number of markersEPGV Unité 1279_GAP2


Technologies de génotypage & séquençage 2011• Nombreuses Technologies• Livret• Description/sélection• Principe• Applications• Technologies associées etapplications dérivéesEPGV Unité 1279_GAP• Développement demarqueurs etGénotypage• Séquençage ₺NGS₺• Description rapide dechaque PF et de lastratégie d’utilisationdes outils3


Outils de génotypage• Les outils de génotypage actuellement disponibles sont efficacespour les espèces végétales• Ces technologies imposent quelques contraintes et une réflexionen amont pour la construction de l’essai• échantillon analysé contrôlé (code-barres)• composition de panels de SNPs utilisables pour différentsprogrammes de recherche• importance du choix des contrôles : homozygotes andhétérozygotes(même artificiel : mélange d’ADN)• production d’ADN : de relativement bonne qualité et surtoutconcentration homogène intra plaqueEPGV Unité 1279_GAP4


Génotypage SNPs: comparatifTaqMan®Golden Gate®Infinium®Taqman® Golden Gate® Infinium®BeadXpress/VeraCodeBeadStationméthode dediscriminationalléliqueASO hybridation5’ exonuclease activityof PCR-DNApolASO/LSO hybridationExtension ASO primerLSO ligationPCRASO hybridationExtension ASO primermultiplexage Non 48 / 96 / 144 / 384 1536 / 384 3000– 90 000nombre d’individus contraintes dudesign des sondes coût / SNP / ind coût initial (K€) (0,5) (80) (80-250)débitN x 3841 jour4 x 964 jours12 x 964 joursdonnées générées 384/384147 000/96588 000/ 4 jours4 800 000/9657 600 000/ 4 joursEPGV Unité 1279_GAP5


Hybridation =bases de ces technologies• Spécificité de l’hybridation• Séquence autour du SNP• Indispensable• Information fiable• Fréquence• GC content• Contexte génomique : duplication, ploïdie…EPGV Unité 1279_GAP6


• cf. présentation P.Mournet (GPTR Génotypage, µsatellites, PFDArT)EPGV Unité 1279_GAP7


Sequençage & Génotypage……avec l’EPGVAnalyse du polymorphisme génétique de type SNP<strong>Marie</strong>-<strong>Christine</strong> Le Paslier…pour l’équipe EPGV_INRAE P G VEtude du Polymorphisme des Génomes VégétauxUnité 1279_DGAP8IG


Contexte 1L’équipe EPGVdirigée par Dominique Brunel5 permanents, 7 CDDsEtude du Polymorphisme des Génomes Végétaux• INRA_GAPInstitut National de la Recherche Agronomique_Génétique et Amélioration des Plantes• Implantée au CEA-IG, composante CNG, EvryCommissariat à l’Energie Atomique - Institut de Génomique / Centre National de Génotypage• Accès aux outils technologiques haut débit développéspour la génomique humaine• Mettre en phase les programmes de recherche de nospartenaires avec les outils technologiques disponibles auCNG…et au GenoscopeEPGV Unité 1279_GAP9


Contexte 2 : compétences / ressourcesIGYann Legros<strong>Marie</strong>-Thérèse Bihoreau et son équipeMario Foglio /Naira Naouar. outils de génotypage SNPsTaqMan, SNPlex, Iplex, GoldenGate,Infinium. outils de séquençageIllumina : HiSeq2000 (x12)Roche : GS-Junior(x2),Ion-Torrent : PGM (x1). outils d’analyse. stockage temporaire des données« brutes ». support IlluminaEquipes ScientifiquesPartenaires. définition des questions biologiques. besoins bio-informatiques. données de référenceEPGVUnité 1279GAPPatrick Wincker et son équipeJean-Marc Aury. outils de séquençageABI : 3730xl (xN)Illumina : HiSeq2000 (x2), GAIIX (x1)Roche : GS-FLX (x3). outils d’analyse. stockage temporaire des données« brutes »URGIINRA-Versailles. repository center. outils d’analyseEPGV Unité 1279_GAP10


• cf. présentation A.Berard (Amplifluor, TaqMan, Infinium)• cf. présentation C.Poncet (PF Gentyane)• cf. présentation Sandra Guilloud Contamine(KASPar)EPGV Unité 1279_GAP11


Les nouveaux outils de (re)séquençageNGS : Next Generation SequencingNTS : Nouvelles Technologies de SéquençageMPS : Massive Parallel Sequencing<strong>Marie</strong>-<strong>Christine</strong> Le Paslier…pour l’équipe EPGV_INRAE P G VEtude du Polymorphisme des Génomes VégétauxUnité 1279_DGAP12IG


Quels enjeux pourles espèces végétales cultivées• Nombre insuffisant de SNPs outils de génotypagehaut-débit non encore utilisablespar exemple• Illumina GoldenGate 1536 plex• Illumina Infinium : iSelect 3000 à 90 000 SNPs• Limite du séquençage allélique Sanger• Structure génomique : taille, polyploïdie• Large diversité génétiqueEPGV Unité 1279_GAP13


NTS : Nouvelles Technologies de SéquençageNGS : Next Generation SequencingGS-FLXGS-Junior454=>1000 $/génome humain3 technologies implantées« 2d generation technologies »« massively parallel sequencing »GASOLIDHiSeqEPGV Unité 1279_GAP14


Les 3 technologies implantées454, Roche - Solexa, Illumina – SoLid, ABI• Préparation de la banque / librairie de molécules• fragmentation (nébulisation, sonication, hydro-shearing)• réparation des extrémités• ligation d’adaptateurs aux extrémités• (sélection de taille, isolement du simple brin)• Amplification clonale de chaque molécule (PCR)• emPCR ou bridge amplification• Séquençage• par synthèse du brin complémentaire ou par hybridationligationEPGV Unité 1279_GAP15


Les 3 technologies implantées454, Roche - Solexa, Illumina – SoLid, LifeTechnologiesMacLean & al, Nature_avril2009séquençage par synthèse / pyroséquençageséquençage par hybridation-ligationséquençage par synthèse, terminateur réversibleEPGV Unité 1279_GAP16


NGSde nombreuses applications• quelle technologie ?• pour quel besoin ?MacLean & al, Nature_avril2009EPGV Unité 1279_GAP17


Les données de séquençageChangements :• Quantité de données • Type de donnéesBesoins Informatiques :• Traitements• stockageAnalyse Bioinformatique MacLean & al, Nature_avril2009EPGV Unité 1279_GAP18


Illumina-Genome Analyser (GA)technologie SolexaPaired-ends GA II GA II GA IIxcluster/seq_versionV2V3 V4 V4Analyse d’images scs2.5 scs2.6 scs2.6Lectures/run 80-100 x 10 6 80-100 x 10 6 192 x 10 6 288 x 10 6 288 x 10 6Longueur de lecture 35 bases 75/100 bases 75 bases 75 bases 100 basesOutput/run 3 Gb 7,5/10 Gb 20 Gb 36 Gb 50 GbOutput/canal 3 Gb 7,5/10 Gb 2.5 Gb 4.5 Gb 6.25 GbTps de run 3-5 jrs 4-9,5 jrs ~ 9 - 10 jrsFlexibilitéExtrémités appariéesLectures appariéesMultiplexage/adressageAvantages /InconvénientsEvolutions8 canaux200 à 5 kb8 tags/canalProfondeur / assemblageLecture à 125 puis 150 basesHiSeq1000 & HiSeq2000 : 100Gb/FC_5jrs/runEPGV Unité 1279_GAP19


Paired-ends HiSeq HiSeq MiSeqcluster/seq_versionAnalyse d’imagesIllumina-HiSeq 2000V1V3Lectures/run 1500 x 10 6 5 x 10 6Longueur de lecture 100 bases 100 bases 36 to 150 basesOutput/run ~200 Gb ~300 Gb 1 – 1,5 GbOutput/canal 25 Gb 35 Gb -Tps de run 11 jrs 11 jrs ~ 1 jrFlexibilitéExtrémités appariéesLectures appariéesMultiplexage/adressageAvantages /Inconvénients2*8 canaux200 à 5 kb24 tags TruSeq IlluminaProfondeur / assemblagePas defractionnementEvolutions96 tags Nextera IlluminaEPGV Unité 1279_GAP20


Roche-Genome Sequenceur (GS)technologie 454GS-FLX GS-FLX GS-JuniorSeq chimie LR70 Titanium XLR70 ? Titanium XLR70Lectures/run 400 x 10 3 1 x 10 6 1 x 10 6 90-100 x 10 3Longueur de lecture 250 bases 400 bases 600 bases 400 basesBases/run 100 Mb 400-600 Mb 35-40 MbTps de run(simple lecture)FlexibilitéExtrémités appariéesLectures appariéesMultiplexage/adressageAvantages /InconvénientsEvolutions7,5 h 10 h 10 h2-4-8-16 fractionnements(avec réduction nb lectures liée au masque)3kb, 8 kb, 20 kb12 MIDs = tags/régionLongueur / Homopolymèreslecture à 5001000 basesautomatisation des étapes de préparationPas defractionnementEPGV Unité 1279_GAP21


Pour en savoir plus !EPGV Unité 1279_GAP22


GAHiSeqEPGV Unité 1279_GAP23


Illumina sequencingSample preparation & clusteringLibrairies• Single Read (SR)• Paired-ends (PE)• Mate-Pairs (MP)EPGV Unité 1279_GAP24


Illumina Sequencing –Librairie- fragmentation génomique /Covaris- librairie « Paired-ends » (PE)- sizing / gel ≈ 400basessample 174VSizing – on gelQuality control: Bioanalyser traceEPGV Unité 1279_GAP25


Illumina sequencing : Sequencing By Synthesis(SBS)dNTP reversible terminatorEPGV Unité 1279_GAP26


Illumina sequencing : ADN dataEPGV Unité 1279_GAP27


• cf. présentation Véronique Gautier (454-seq pool de BACs)EPGV Unité 1279_GAP28


PerspectivesE P G VEtude du Polymorphisme des Génomes VégétauxUnité 1279_DGAP29IG


Débit & Mise en œuvre‣ Augmentation des débitset des longueurs de séquences‣ Passage au haut débit de préparation des librairies : automatisation de séquençage de librairies : multiplexage‣ Augmentation du multiplexage96 tags pour les librairies Nextera-Illumina‣ Multiples choix de kits/fournisseurs de préparation delibrairiesEPGV Unité 1279_GAP30


De nouveaux formats surdes technologies existantesouDe nouvelles technologies= personal sequencing machine• Roche : 454 GS-Junior• 35 Mb/run• Illumina : MiSeq• 1,5 Gb/run• Ion Torrent : PGM (Personal Genome Machine)• incorporation d’un nucléotide par la polymérase->libération d’un proton ->variation de pH• semiconductor sequencing technology• 50 à 300 Mb/run• Rothberg et al, Nature,475, 21Juillet2011EPGV Unité 1279_GAP31


De nouvelles technologies= 3d generationsingle molecule• Demande de financementSMRT (Single Molecule Real Time• technologie nanoporesEPGV Unité 1279_GAP32


De nouvelles technologies associéesDe nouvelles applicationsRéduction de complexité génomiqueEnrichissement de régions d’intérêt contexte séquençage « NGS»• Technologies de capture de régions d’intérêt(Agilent, Nimblegen, Illumina)• sur puce• en milieu liquide• Technologie microfluidique pour séquençage NGS d’amplicons(Fluidigm, Raindance) Multiplexage d’échantillons indexés• RRL : Reduced Representation Librairie• LR-PCREPGV Unité 1279_GAP33


‣ RRLs :reduced-representation librarieset des longueurs de séquences‣ RAD-seq : restriction-site-associated DNA‣ Low coverage genotypingMSG : Multiple Shotgun Genotyping (Andolfatto et al)GBS : Genotyping By Sequencing (Elshire et al)EPGV Unité 1279_GAP34


Multiple Shotgun Genotyping (MSG)EPGV Unité 1279_GAP35


Genotyping by Sequencing (GBS)EPGV Unité 1279_GAP36


Merci de votre attentiondiscussion !EPGV Unité 1279_GAP37

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!