11.02.2015 Views

CR journées CATI BIOS4Biol 28 29 janvier 2013 28 janvier matinée ...

CR journées CATI BIOS4Biol 28 29 janvier 2013 28 janvier matinée ...

CR journées CATI BIOS4Biol 28 29 janvier 2013 28 janvier matinée ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>CR</strong> journées <strong>CATI</strong> <strong>BIOS4Biol</strong><br />

<strong>28</strong> ­ <strong>29</strong> <strong>janvier</strong> <strong>2013</strong><br />

<strong>28</strong> <strong>janvier</strong> ­ matinée<br />

Présentation programme<br />

37 personnes sur les 40 +/­ qui composent le <strong>CATI</strong>.<br />

Tour de table avec réponse aux questions :<br />

­ qui suis­je<br />

­ que fais­je<br />

­ pour qui je le fais<br />

­ comment je le fais<br />

­ quel est mon principal projet"<br />

Présentations individuelles souvent très rapides (moins des 2mn accordées). Pas un problème<br />

en soit puisqu'il y a l'annuaire des compétences.<br />

Présentation des différentes structures : (reprendre les présentations serait sans doute mieux ;­)<br />

● Plate­forme Métabolomique (Bdx CGFB ­ Génomique fonctionnelle) ­ Daniel<br />

○ Analyse/Identification métabolite<br />

○ Moyen 3.45 kE HT<br />

○ Personnel impliqué en 2012 23 permanents soit 7.2 ETP<br />

○ accueil master / thèse / postdoc<br />

○ ISO9001<br />

○ entre services et collaborations<br />

○ Projet principalement plante/fruits charnus<br />

○ Réseaux RENABI, METABO (avec Saclay, Clermont, Toulouse) ...<br />

●<br />

Plate­forme Bioinfo Bdx CBiB ­ David<br />

○ ISO9001<br />

○ 10 personnes<br />

○ Infrastructure matérielle : juste 32 cores, s'appuie sur mesocentre Aquitaine<br />

(3000 cores)<br />

○ Missions thèmes :<br />

■ Prestations : hébergement / Dév logiciel / Ingénieurie Bioinfo …<br />

■ Recherche Dév<br />

■ Formation<br />

■ Veille techno<br />

○ Projets :


■<br />

■<br />

■<br />

■<br />

■<br />

Génome abricot<br />

Métagénomique<br />

Génomique comparative<br />

Métabolite<br />

COSMOS<br />

●<br />

●<br />

●<br />

●<br />

Métatoul ­ Marie<br />

○ Créé en 2005<br />

○ métabolisme, fluxomique, RMN, lipidomique ...<br />

○ IBISA ­ CNOC<br />

○ ISO9001 en fin d’année<br />

○ Moyen => 6 <strong>CR</strong> / 20 Ingénieurs<br />

○ Biochimie métabolique<br />

○ Chimie analytique<br />

○ RMN …<br />

Plate­forme métabolomique Clermont­Ferrand Theix ­ Franck<br />

○ UMR nutrition humaine<br />

○ Plateforme exploration du métabolisme (RMN, spectro)<br />

○ 8 chimistes, 1 biostat, 1 info, 1 bioinfo, 1 qualité<br />

○ ISO9001 en 02/<strong>2013</strong><br />

○ 3 projets ANR<br />

○ 3 projets EU<br />

GeT Plage ­ Claire<br />

○ Séquençage<br />

○ Génotypage<br />

○ 17 pers dont 3 bioinfo<br />

○ Production de données / mise à disposition d'infrastructure<br />

○ NG6 (plateforme web de stockage NGS)<br />

○ Equipement :<br />

■ 2 HiSeq 2000<br />

■ 1 MiSeq<br />

■ 1 454<br />

■ 1 BioMark<br />

■ 1 BeadXpress<br />

GeT genome et transcriptome ­ TRIX (Transciptomic impact of Xenobiotics) ­ Yannick<br />

○ Microarray (agilent) et qP<strong>CR</strong><br />

INRA INSERM CNRS...<br />

TOXALIM TRIX Genotoul Bioinfo<br />

GeT genome et transcriptome


Genotoul Biostat<br />

Privé<br />

●<br />

●<br />

●<br />

●<br />

●<br />

GeT Biopuces ­ Sophie<br />

○ Service GeT Biochips<br />

○ Biochips ­ Bionanotechno ­ R&D<br />

○ Des plans d’expé aux analyses stats<br />

○ 13 personnes (1 chef, 5 service, 7 recherche)<br />

GenoToul Bioinfo ­ Antoine<br />

SIGENAE ­ Karine<br />

UBIA ­ Damien<br />

○ Dépt MIA<br />

○ 2 équipes de recherche<br />

■ MAD modélisation des agroécosystèmes<br />

■ SaAB Stat et algo pour la biologie<br />

○ 3 PF<br />

■ Record<br />

■ SIGENAE<br />

■ Genotoul Bioinfo<br />

○ Recherche méthodo<br />

■ Modèle graphe stat<br />

■ Prog par contrainte<br />

○ Logiciel<br />

■ Cartagene (construction de carte génétique RH)<br />

■ MCQTL<br />

■ ToulBar2 (design de prot)<br />

■ Appollo RNA<br />

■ RNAspace<br />

■ eugene<br />

Plateau transcriptomique de Rennes LPGP ­ Jérôme<br />

○ 2 personnes<br />

■ Jérôme Montfort (analyse)<br />

■ Aurélie Le Cam (expé)<br />

○ Réalisation<br />

■ Microdissection laser<br />

■ miRNA truite => puce<br />

■ Métaanalyse


■ OSCILE mise en évidence de profils d’expression conservés chez 4<br />

espèces<br />

●<br />

●<br />

<strong>CR</strong>B­Gadie ­ Sylvain<br />

○ Activités<br />

■ Gestion BAC<br />

■ Stockage échantillons bio<br />

■ Atelier microarray commerciaux<br />

■ Production de librairies NGS<br />

○ CNOC IBISA ISO9001<br />

○ 4 pers : 1IR 1IE 2Tech<br />

Labo Physiologie de la reproduction et des comportements de Tours ­ PRC ­ Géraldine<br />

○ Personnels:<br />

■ 150 scientifiques, ingénieurs, techniciens et administratifs ;<br />

■ 150 à 200 stagiaires par an.<br />

■ 10 équipes de recherche<br />

○ Missions<br />

■ Département PHASE (Physiologie Animale et Systèmes d’Elevage)<br />

■ La PRC mène des recherches fondamentales et appliquées sur la<br />

fonction de reproduction d’espèces domestiques (bovins, ovins, caprins,<br />

équins, aviaires et porcins), d’espèces modèles (rats, souris) et sur les<br />

comportements animaux sexuels, maternels et sociaux.<br />

■ Études également sur l'espèce humaine.<br />

■ Études et études de la conservation des espèces sauvages.<br />

■ Liens forts avec les départements Génétique Animale et Santé Animale


<strong>28</strong> <strong>janvier</strong> ­ après­midi<br />

Travail en groupe :<br />

­ Groupe “séquence” ­ Géraldine<br />

BILAN de l’existant:<br />

● les infrastructures d’appartenance communiquent entre elles, même avant la création du<br />

<strong>CATI</strong> et particulièrement avec les deux structures coeur du <strong>CATI</strong> i.e. Genotoul bioinfo et<br />

Sigenae<br />

●<br />

●<br />

●<br />

●<br />

le bilan des produits et réalisations des membres du groupe:<br />

○ Ng6, Phyleasprog, Ngs­pipelines, Rnaspace, Easytoul, SVN bio­info utils,<br />

Galaxy*, Sig­learning*, Scripts*, sig­reannot*, Benchmarking*<br />

*à mettre en commun post­<strong>CATI</strong><br />

les projets: Funhymat, CartoSeq, D­livers, SOSRNA<br />

les éléments du métier: Chaîne de traitement, Interface utilisateur, Base de données<br />

le partage de réunions (SIGENAE – Plateau transcriptomique ­ <strong>CR</strong>B GADIE // Bioinfo<br />

genotoul – Get­Plage )<br />

A faire:


●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

un projet bottom­up: benchmarking<br />

partager les compétences dans le groupe<br />

rééquilibrer les connaissances entre bioinfo et statistiques. Organisation de formation<br />

générique entre communauté au sein du <strong>CATI</strong> <br />

partager les scripts Perl et python (obligation de documentation des scripts / production<br />

d'une page de requête sur les scripts disponibles (assurer les veille sur ses scripts))<br />

remonter annuellement des besoins de formation<br />

partager les demandes qui viennent des utilisateurs pour de nouvelles demandes<br />

(Forum)<br />

annuaire de compétences à maintenir<br />

Que pourrait produire le groupe en fin d’année :<br />

● Publis “individuelles”<br />

● Publis inter­structure<br />

● Projets inter­structure<br />

● Des rencontres, quelle thématique <br />

○ Ouverture des réunions SIGENAE au <strong>CATI</strong> pour faire des réunions à thèmes<br />

● Annuaire de compétences<br />

● Site web <strong>CATI</strong> <br />

­ Groupe infrastructure ­ Didier<br />

● Personnes présentes :<br />

○ Damien Leroux (Toulouse ­ développement. optimisation de code, parallélisme)<br />

○ Patrice Déhais (Toulouse ­ développement, bioinfo install et utlisation, SGBD,<br />

admin)<br />

○ Didier Laborie, Marie­Stéphane Trottard (Toulouse ­ bioinfo install, SGBD, admin)<br />

○ David Benaben (Bordeaux ­ bioinfo install, SGBD, admin)<br />

○ Franck Giacomoni (Clermont ­ bioinfo install et utlisation, SGBD, admin)<br />

● Ensemble :<br />

○ Admin syst : tout le monde en fait, avec des choix divers quant aux solutions et<br />

techniques, il semblerait judicieux de pouvoir essayer D'UNIFORMISER/<br />

STANDARDISER pour pouvoir mieux partager ... le point suivant peut être un<br />

moyen d'y parvenir<br />

○ IFB (ex Grisbi) : presque tous ont eu à faire avec Grisbi (mise à disposition de<br />

nœuds, ou simple utilisation). Une implication de certains d'entre nous dans l'IFB<br />

permettrait de faire remonter nos besoins ou de savoir vers quoi tendre pour se<br />

rapprocher d'un tout homogène partageable.<br />

○ Déploiement de logiciels et machine virtuelle : la virtualisation est déjà en place<br />

chez les différents interlocuteurs, et la solution retenue est la même (VmWare).<br />

Un partage et mise à disposition d'outils/de solutions semble pouvoir se faire


assez simplement (PRA)<br />

○ Infrastructure : est ce qu'un mode de partage pourrait émerger <br />

■ installation des mêmes outils/logiciels de chaque côté<br />

■ exécution à distance et installation et maintenance uniquement par la<br />

partie la plus opérationnelle sur le dit produit<br />

■ pour ce qui est du stockage, l'expérience des uns peut profiter aux autres,<br />

mais le partage ou la mise à disposition n'est pas encore à l'ordre du jour,<br />

car les besoins nécessitent des moyens locaux pour des questions de<br />

performance. Avec l'amélioration des réseaux et mise en place de VPN ...<br />

pourquoi pas (SGBD, données de référence publiques ...).<br />

○ Galaxy : semble être en vogue partout. Question : comment partager autour de<br />

Galaxy <br />

■ échange d'installation sous forme de VM (pose le problème des softs<br />

sous­jacents, du cluster, de l'authentification)<br />

■ partage des workflows (même remarque)<br />

■ => mis à part un partage d'expériences et de pratiques, le reste ne peut<br />

se faire sans uniformisation, standardisation des couches logicielles et<br />

matérielles avec un partage de ces dernières.<br />

○ Parallélisation : la parallélisation gros grain est assez bien gérée par les<br />

personnes pouvant disposer d'un cluster, mais il y a de plus en plus de cas avec<br />

l'arrivée du haut débit un peu partout où des logiciels "sans source et hors<br />

maintenance" se retrouvent à leur limite d'utilisation (vrai en stat, métabolo,<br />

génétique ...). Une parallélisation fine est alors nécessaire (multi threads, MPI,<br />

GPU). Pour le moment le seul à avoir de telles compétences est Damien.<br />

­ Groupe stat ­ Luc<br />

● Peu d’outils communs (autant de statistiques différentes que de statisticiens ou de types<br />

de données à analyser). Seul socle commun peut être : les ACP.<br />

● Quelques problématiques communes néanmoins :<br />

○ Sélection de variables<br />

○ Simplification / élimination de bruits<br />

● Des interrogations :<br />

○ que peut on apporter aux biologistes (meilleurs outils, visualisation ...)<br />

○ qu'attend l'INRA comme résultat des <strong>CATI</strong><br />

● Peut être deux sous groupes : Métabo / Microarray car difficile de mener les deux de front<br />

en 4 ans seulement.<br />

Présentation <strong>CATI</strong> (historique...) ­ Christophe<br />

● D'où vient la notion de <strong>CATI</strong> ... et de la prime info<br />

● oubli et renaissance des <strong>CATI</strong> pour légaliser cette dernière<br />

● .../...


<strong>29</strong> <strong>janvier</strong> ­ matinée<br />

1. Organisation<br />

○ Taille des groupes<br />

■ ⅔ biofino (trop gros comment le structurer/découper)<br />

■ ⅙ biostat<br />

■ ⅙ système<br />

2. Produire ­ Produire, ou développer, mettre en place une infrastructure pour répondre à<br />

un besoin commun<br />

○ Ce qui marche<br />

■ SIGENAE/Bioinfo genotoul<br />

● NGSpipeline<br />

● RNAspace<br />

■ Bioinfo / Plage<br />

● NG6<br />

3. Partager<br />

○ Pratiques<br />

○ Code<br />

○ Environnement<br />

■ Entrepôt de données<br />

■ Chaines de traitement<br />

■ Interfaces (NG6 ­ regrouper les données du <strong>CATI</strong> )<br />

■ Système, cluster de calcul, virtualisation (poste de W, serveur de prod...)<br />

■ Framework (mashup, openajax, EBI bioJS)<br />

○ Interaction entre les 3 groupes du <strong>CATI</strong><br />

■ échange de ce qui marche ET de ce qui marche pas<br />

■ script …<br />

○ Plan expérimental (stat)<br />

4. Projet commun<br />

○ Formation intra <strong>CATI</strong><br />

○ Formation inter <strong>CATI</strong> / même objet<br />

○ Organisation en binomes<br />

■ bioinfo bioinfo<br />

■ bioinfo stat<br />

Discussion autour de la production des <strong>CATI</strong> <br />

Ontologie La “donnée” …<br />

5. Les moyens à demander <br />

○ actuellement 200euros par personne<br />

Présentation Christine GASPIN<br />

Présentation Denis MILAN


Participation aux questions/réponses de Frédérick Garcia<br />

Discussion avec Christine GASPIN, Denis MILAN et Frédérick GARCIA<br />

● Qu’est ce qui caractérise ce <strong>CATI</strong> <br />

● Quel périmètre<br />

● Auberge espagnole<br />

● Coeur fort autour de deux PF (bioinfo / SIGENAE)<br />

● Supra <strong>CATI</strong> (Christine responsable)<br />

● Production du <strong>CATI</strong> :<br />

○ “Pas spécialement mais on regardera en quoi le fait d’être dans un <strong>CATI</strong> améliore<br />

votre production”<br />

● Christine ­ qu’attendez vous de nous => Interface DU<br />

● Denis : le <strong>CATI</strong> est une coquille vide pour légaliser la prime. l'INRA a voulu en tirer<br />

quelque chose de plus : une première structuration (fourre­tout), puis une seconde (sans<br />

doute encore trop verticale) ont abouti à cette dernière mouture. À nous de remplir cette<br />

coquille et d'en faire quelque chose d'utile.<br />

En théorie il devrait y avoir des lettres de missions pour les responsables scientifiques et<br />

techniques ... mais pratiquement il n'y en aura pas, sauf en cas de problème. Donc dans<br />

la pratique, il n'y a pas véritablement de ligne directrice. Les textes eux­mêmes sont très<br />

ouverts (possibilité de monter des projets, de faire des demandes de recrutements),<br />

ceux qui empiète sur les compétences jusqu'à lors détenues par les unités et de leurs<br />

responsables.<br />

● Toujours un flou et une confusion dans la suite de la discussion autour des mots<br />

"Produire" et "Rapport".<br />

Note perso, Patrice: à bien y réfléchir, je ne pense pas que la production au sein d'un<br />

<strong>CATI</strong> ne doive dépasser le cadre du développement ou de la mise en commun<br />

d'infrastructure, de logiciel, ou de méthode. Tout l'aspect production de donnée ou<br />

traitement doit rester au sein des entités (plate­formes, unités, ...).<br />

=> La notion de rapport d'activité ne devra donc concerner que ce qui aura été fait<br />

ensemble pour faciliter la production individuelle de chacun au sein de nos équipes<br />

respectives ...<br />

=> La notion de projet par le <strong>CATI</strong> peut avoir son sens dans des structures comme<br />

EADgenes, mais pas vraiment par exemple dans une ANR en tant que service ou<br />

collaborateur, hormis dans le cadre de recherche en (bio)info pure.<br />

=> La demande de poste, toujours dans ce cadre de non production/traitement, bien que<br />

possible d'après les textes, devient sans doute plus difficile voire uniquement théorique.<br />

<strong>29</strong> <strong>janvier</strong> ­ après­midi<br />

Plan d’action <strong>2013</strong><br />

Que partager :<br />

● NG6 (stockage des données) ­ 4<br />

● Pratiques / Savoir faire ­ 20


● Choix techno ­ 12<br />

● Bouts de code / Forge (SVN) ­ 25<br />

● Formations ­ 13<br />

● Liste / analyse des besoins utilisateurs et le notre ­ 3<br />

● Worflow ­ 14<br />

● Partage de moyens logiciels / BD / VM ­ 3<br />

● Collabo dév ­ 4<br />

● Annuaire des compétences ­ 5<br />

● Canal IRC ­ 2<br />

● Lettre info<br />

● Ouverture réunion ­ séminaire <strong>CATI</strong> ­ 3<br />

● Info mail (site)<br />

Retenus :<br />

● Séminaire visio mensuel (réunion groupe SIGENAE juste avant) ­ Christophe<br />

● Canal IRC ­ Damien<br />

● Workflow / galaxy ­ Sarah<br />

● Bouts de code ­ Olivier<br />

● Site web (wiki) / Logo / Charte graphique ­ Céline Hélène Cédric Philippe<br />

Remarques :<br />

● Groupe phylogénie évolution (géraldine ­ hélène ­ claire ­ francois ­ sarah … )<br />

En cours de réflexion sur du moyen/long terme<br />

Formation phylogénie<br />

Pipeline galaxy<br />

● Réunion anuelle 2014<br />

○ Tour de table des pers. et réalisations<br />

○ Réunion par groupe (problème des personnes à cheval entre deux groupes)<br />

○ Partage inter groupe<br />

○ Fédération des travaux pour la période à venir

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!