Les données non-structurées, une mine à exploiter

Publié le 03/01/2017

experience client

À côté des données faciles à ranger dans les cellules d’un tableur ou une base de données, les entreprises et organisations collectent quantités d’autres informations, non-structurées, qu’elles ne savent pas exploiter. Une mine d’enseignements potentiels que des technologies comme le big data, le machine learning ou l’analyse sémantique s’attaquent à creuser. Entretien avec un spécialiste de ces questions, Fabien Poulard, CEO de la startup nantaise Dictanova. Il interviendra le 19 décembre lors de la Technoférence #19 : “L’intelligence artificielle, le big data et moi : quelles évolutions ?”

Organisée par Images & Réseaux, la Technoférence #19 se tiendra le jeudi 19 janvier de 8h30 à 12h30 à Télécom Bretagne à Rennes (et à partir de 9h en visioconférence à Nantes, Brest, Laval, Lorient et Le Mans). Fabien Poulard interviendra sur le thème : “Tirer parti des données non-structurées pour enrichir la connaissance client”.

Dictanova commercialise en SaaS un logiciel d’analyse de l’expérience client. Comment ça fonctionne ?

Fabien Poulard. Nous travaillons à partir de données de type texte, qu’on appelle verbatims, qui sont des commentaires ou des avis laissés par les clients pour expliquer leur satisfaction ou à l’inverse leur insatisfaction. Les organisations disposent de volumes tellement importants de retours clients que, bien souvent, elles renoncent à les traiter. Certaines prélèvent des échantillons de temps à autre pour les analyser mais, la plupart du temps, les données textuelles sont négligées.

Avec Dictanova, il devient possible de travailler sur l’ensemble des ressources disponibles. Notre outil permet d’extraire des indicateurs sur les sujets dont parlent les clients et sur leur perception de ces sujets. Des indicateurs qui sont ensuite consolidés statistiquement pour donner à l’organisation une vision synthétique du vécu des clients. Au départ, ça nécessite un peu de paramétrage puisqu’il faut injecter de la connaissance métier dans le système pour qu’on puisse en tirer des analyses profitables. Ensuite, le traitement est totalement automatisé.

Quelles technologies sont mises en œuvre ? Du big data, de l’intelligence artificielle ?

Un peu tout ça à la fois. C’est du big data parce qu’on traite des volumes de données extrêmement conséquents. Mais c’est aussi une forme d’intelligence artificielle, de l’analyse sémantique, qui permet de comprendre le langage humain pour en tirer des indicateurs intéressants. Le traitement est étroitement lié à la langue. Aujourd’hui Dictanova supporte le français, l’anglais et le chinois. Pour intégrer une nouvelle langue, il faut passer par des développements R&D importants.

Peut-on illustrer par un cas d’usage ?

Il est difficile de donner un exemple très concret puisque ça touche à la performance des entreprises et organisations pour lesquelles nous travaillons. Mais disons que, de manière générale, l’analyse des retours clients permet d’identifier rapidement des problèmes opérationnels qui n’étaient pas connus et de mettre en place des solutions pour y remédier. L’intérêt, c’est de retenir le client. Le contexte a évolué. Dans le passé, une entreprise cherchait continuellement à acquérir de nouveaux clients. Nous sommes arrivés aujourd’hui à une époque de saturation des marchés, dans laquelle les entreprises ont pris conscience de l’importance de conserver leur clientèle existante. Nous nous inscrivons complètement dans cette tendance puisque notre outil a clairement pour objectif de fidéliser les clients.

Comment évolue le marché des données non-structurées ? Quelles sont les perspectives de croissance ?

Le potentiel est énorme. On estime à plus de 75% la part des données non-structurées dans les entreprises. Mais il est difficile de considérer ce marché comme un tout, car il recouvre des réalités très différentes. Dictanova est positionné sur le marché de la satisfaction client lié aux services marketing, mais il existe bien d’autres usages spécifiques. Par exemple dans le domaine juridique où on développe des outils pour suivre les évolutions des textes réglementaires dans la durée ou pour analyser automatiquement des contrats. Dans la santé, par exemple pour rechercher dans des rapports de suivi d’éventuelles contre-indications à l’utilisation simultanée de deux médicaments. Dans l’industrie aéronautique pour analyser des rapports d’intervention sur des avions et comprendre comment améliorer la maintenance… Si l’on considère le marché des données non-structurées de façon globale, les perspectives de croissance sont très importantes.

Fabien Poulard

Fabien Poulard – Dictanova

Plus

Technoférence #19. Programme et inscription.

www.dictanova.com