31.10.2014 Views

un logiciel de scaffolding intégrant différents sources d ... - Inra

un logiciel de scaffolding intégrant différents sources d ... - Inra

un logiciel de scaffolding intégrant différents sources d ... - Inra

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Un peu <strong>de</strong> jargon: processus d’assemblage, contigs<br />

et scaffolds, paired-end, mate-pairs<br />

10 avril 2013 – Colloque EPGV – Lusignan – Jerome.Gouzy@toulouse.inra.fr<br />

paired-end<br />

longueur <strong>de</strong><br />

l’insert 200-600bp<br />

Contig 1 Contig 2<br />

Scaffold 1<br />

Légen<strong>de</strong>: Les flèches représentent les fragments <strong>de</strong> séquences fournis par les séquenceurs. Les<br />

traits en pointillés qui connectent les flèches représentent <strong>un</strong> lien <strong>de</strong> longueur connue entre les<br />

<strong>de</strong>ux extrémités séquencées. Les couleurs représentent <strong>de</strong>s tailles d’inserts différentes obtenues<br />

par différents protocoles expérimentaux.<br />

Dans <strong>un</strong> premier temps les chevauchements entre séquences sont détectées et utilisés pour<br />

construire <strong>de</strong>s séquences continues plus longues que l’on nomme « contigs ». Dans <strong>un</strong> <strong>de</strong>uxième<br />

temps, les inserts « longs » sont utilisés pour ordonner les « contigs » en « scaffolds ». Les trous<br />

entre les contigs, essentiellement dus aux séquences répétées, sont représentés par la lettre ‘N’<br />

dans l’assemblage.<br />

mate-pair<br />

longueur <strong>de</strong><br />

l’insert 3,5,8,10kb,<br />

20kb, « 40kb »

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!