Publié le 11/06/2019
La startup rennaise Enancio s’est lancé un défi d’envergure : développer un format de compression des données génomiques si performant qu’il s’impose comme standard d’échange et de stockage des informations issues du séquençage de l’ADN. Le bénéfice attendu est économique. Également sociétal, car il s’agit de faciliter l’accès à la médecine personnalisée et aux thérapies ciblées.
Non compressées, les données génomiques d’un seul patient représentent 500 Go. “L’équivalent de 200 films full HD” compare Jennifer Del Giudice, CEO de la startup Enancio. Une montagne d’informations qu’il faut pouvoir transférer pour analyse. Mais également stocker pendant plusieurs années parce que les outils de traitement évoluent et qu’ils pourraient, demain, révéler des informations aujourd’hui hors de portée.
D’ici 2025, l’accumulation des données génomiques dans le monde se compterait “en zettaoctets” avance la spécialiste en génétique devenue dirigeante d’entreprise. Mais qu’est-ce qu’un zettaoctet ? “C’est 10 à la puissance 21. Ce sont des échelles connues dans le monde astronomique. Et, c’est bien de ça qu’il s’agit : nous allons vers une quantité astronomique de données génomiques à gérer.”
Enancio a été créée en août 2017 avec la volonté initiale de créer des outils qui facilitent le travail des biologistes. Mais après la première année, elle s’est rendu compte que la compression des données génomiques est le point clé sur lequel il fallait focaliser ses travaux. Pour cela, elle dispose d’un argument de poids. Son CTO, Guillaume Rizk, est “l’expert français de la compression et des calculs hautes performances sur la génomique”, compétence qu’il avait développée notamment au sein de l’Inria.
Aujourd’hui, la petite équipe – trois personnes pour l’instant – a développé le logiciel de compression appelé Lena. Celui-ci traite les fichiers fastq en sortie des séquenceurs ADN de nouvelle génération. Comparé aux logiciels de compression non spécifiques tels que gzip, largement utilisé par les professionnels, Lena se montre “cinq fois plus performant et trois fois plus rapide”. Et cela sur une machine ordinaire “comme un laptop”. Au final, le volume des données brutes est divisé d’un facteur 30 environ, ce qui accélère les transferts et diminue les coûts de stockage : “Toute la chaîne de traitement des données génomiques en bénéficie.”
À terme, le format mis au point par Enancio pourrait modifier la donne en profondeur. “Tout comme le MP3 a révolutionné le monde de la musique, sauf que dans notre cas la compression se fait sans perte d’information.” En allégeant le poids des fichiers, la startup rennaise réduit considérablement le coût d’accès à la médecine génomique, jusqu’alors facteur limitant.
Le séquençage du génome humain est utilisé pour identifier les variants génétiques marqueurs d’une prédisposition ou impliqués dans une pathologie déclarée. “À partir de cette caractérisation, on peut se focaliser sur le mécanisme biologique impliqué. Les thérapies ciblées, adaptées aux spécificités du patient, sont au cœur de la médecine personnalisée.”
Le logiciel Lena étant maintenant opérationnel, 2019 est l’année qui marque le début de l’activité commerciale. Tous les professionnels de la génomique sont potentiellement intéressés : plateformes de séquençage, plateformes d’analyse, hôpitaux, laboratoires pharmaceutiques… Au-delà du monde de la santé, la génomique animale et la génomique végétale sont aussi des secteurs concernés. Enancio prévoit de se rémunérer sur la compression de données, tandis que l’utilitaire de décompression sera téléchargeable gratuitement.
Le marché, d’emblée international, impose la mise en place d’une force commerciale en conséquence. Les activités de R&D se poursuivent activement. L’équipe devrait grossir de plusieurs unités. Sur tous ces sujets, Jennifer Del Giudice se révèle “confiante”. De même que sur leur financement : “Nous sommes en phase de levée de fonds.”
Photo : l’équipe d’Enancio devant ses locaux de l’IMT Atlantique Rennes où la startup est hébergée. De gauche à droite : Stéphane Picq (DevOps), Jennifer Del Giudice (CEO), Guillaume Rizk (CTO).
Quelles solutions numériques pour les biotechs de demain ?
Journée Numérique et Biotech le mardi 18 juin 2019 à l’IRT b<>com à Rennes
Conférences, table-ronde, networking, ateliers thématiques…