Les logiciels de flux de travaux

Un logiciel de flux de travaux est tout d'abord un outil permettant d'exécuter un ensemble de processus de façon automatique. Ses objectifs principaux sont de :

1.  D'automatiser des processus d'analyse répétitifs en les reliant dans un « pipeline ».

2.  De lancer des analyses sur des architectures matérielles complexes telles des grilles de calculs, serveurs distribués  ou tout simplement des serveurs à haute capacité.

3.  De formaliser le processus d'analyse du flux des travaux

4.  D'intégrer des services et logiciels hétérogènes

5.  De supporter la reproductibilité des résultats

6.  De supporter la distribution et la gestion de données hétérogènes

7.  De permettre l'interaction humaine machine

8.  De permettre la surveillance pendant le fonctionnement et la reprise dans le cas d'erreurs

Cependant, deux sortes de logiciels de flux de travaux se distinguent par:

1.  Les logiciels de flux de travaux qui permettent aux chercheurs de manipuler leurs données et exécuter leurs analyses sans posséder de connaissances en écriture de scripts ou en bases de données. Les données sont rapatriées au sein du logiciel de flux de travaux, permettant l'exécution d'un ensemble de tâches, à travers des modules pré-installés. Par exemple, en séquençage, le logiciel de flux de travaux permet de convertir des séquences en formats divers, de les filtrer  ou de les assembler, etc. Les logiciels de flux de travaux ISYS (2001), BioMOBY (2001), Taverna, Galaxy et Armadillo entrent dans cette catégorie.

2.  Les logiciels de flux de travaux qui assurent un accès direct à des composants (installés sur le serveur) et/ou aux données génomiques sans passer par un rapatriement préalable des données. WildFire, Pegasys ou Ergatis font partie de cette catégorie. De manière générale ces logiciels de flux de travaux sont plus difficiles à prendre en main mais sont plus flexibles.