En quoi consiste la modélisation prédictive ?
 

Frank Vanden Berghen : « Également appelée "Machine Learning", il s’agit là d’une des nombreuses activités regroupées sous l’appellation générique "big data". La plupart du temps, il s’agit de prédire le comportement de clients, par exemple pour le churn, soit l’action de se désabonner, ou le cross-selling, soit la vente d’un produit supplémentaire à un client déjà connu. Les sociétés friandes de ce type de modèles prédictifs sont les banques, assurances, télécoms et chaînes de supermarchés. »

 

Quelles ont été les évolutions majeures ces dernières années dans le traitement des données ?
 

F. V. B. : « Depuis 30 ans, les "use-cases" ont peu changé. Dans les années 90, seules les grandes entreprises s’offraient le luxe de faire des modèles prédictifs. Grâce aux "Machine Learnings", mais aussi au "hype" sur le big data, les petites entreprises ont également pris connaissance des profits qu’elles pouvaient générer et tentent maintenant aussi de s’y mettre. Dans les telcos, par exemple, le taux annuel de rotation de la clientèle est de 20 % en moyenne : s’il y a un million d’abonnés, environ 200 000 s’en iront. Cela représente une perte de gain de quelque 6 millions d’euros par an, soit 300 euros de revenus annuels par abonné. En anticipant ces départs à l’aide d’un modèle prédictif, on peut effectuer une action de rétention ciblée, par exemple en offrant un mois de communications ou une tablette aux possibles churners. Au final, ceci permettra de récupérer entre 5 % et 30 % de ces 6 millions d’euros. »

 

Comment fonctionne votre logiciel de modélisation prédictive ?
 

F. V. B. : « TIMi Modeler est l’un des rares outils qui fait du "automated machine learning" (AML). Il analyse un data set, en général un simple fichier texte, où chaque ligne correspond à une personne avec une série d’informations réparties en colonnes. Si on reprend l’exemple qui précède relatif au churn, il y a une colonne dite "cible" avec une valeur "vrai" pour toutes les personnes qui viennent de partir, et une valeur "faux" dans le cas contraire. TIMi Modeler analyse ce tableau pour déterminer automatiquement les caractéristiques communes à toutes les personnes pour lesquelles la colonne "cible" est "vraie". Il recherche ensuite dans la base de données opérationnelle de l’entreprise toutes les personnes répondant aux critères "discriminants" (déterminés ci-avant) et les sélectionne en vue d’une action de rétention. Cela diffère d’une sélection manuelle basée sur une requête SQL car, avec TIMI Modeler, il n’y a pas d’intervention humaine pour écrire les critères de sélection. De plus, cet outil arrive à "prédire le futur" de façon beaucoup plus précise que n’importe quel humain ou autre outil, ce qui se traduit directement par un fort ROI. »

 

En quoi ce logiciel se différencie-t-il encore des solutions de business intelligence classiques ?
 

F. V. B. : « Toutes ces dernières nécessitent beaucoup de travail pour arriver au bout d’un projet de modélisation prédictive. L’étape préliminaire est de collecter, de nettoyer et d’assembler les données. Malheureusement, beaucoup de sociétés consacrent encore toute leur énergie à travailler sur des besoins purement opérationnels et n’arrivent pas dégager assez de temps pour franchir cette étape fort laborieuse. C’est là où un framework analytique comme TIMi, qui est 100 % en "self-service", montre une forte valeur : en utilisant juste sa souris, on pourra manipuler à grande vélocité de larges volumes de données sans coder, ainsi que créer sur ces mêmes données des dashboards et des modèles prédictifs très précis. En réalité, grâce au "self-service", une société qui adopte TIMi voit bien souvent tous ses processus digitaux devenir plus agiles, plus robustes et plus raffinés. »

 

C’est souvent une vraie révolution pour les sociétés…
 

F. V. B. : « Effectivement ! En Afrique, par exemple, nous réalisons quotidiennement toute l’analytique d’opérateurs télécoms qui comptent jusqu’à 60 millions d’abonnés : vue client à 360°, data warehouse, data lake, KPI, dashboards, plusieurs centaines de modèles prédictifs, etc. De plus, pour cela, nous n’utilisons que 1 ou 2 laptops, alors que toutes les solutions actuelles - open source ou payantes - exigent des centaines de serveurs et des dizaines d’informaticiens pour, au final, produire des résultats inférieurs. Un autre facteur différenciant est l’existence d’une version communautaire de TIMi, 100 % gratuite et pratiquement illimitée. »

 

Quel impact aura le General Data Protection Regulation (GDPR) ?
 

F. V. B. : « Les sociétés ont très peur du GDPR, qui entre en vigueur en mai prochain. En cause : la taxe administrative, qui pourra atteindre jusqu’à 4 % du chiffre d’affaires. Pour l’éviter, il faut faire deux choses : éliminer de la base de données toute personne qui le demande et éviter les fuites de données confidentielles. Ces données sont traitées dans de nombreux outils comme le nôtre ou ceux d’Oracle, SAS, etc. TIMi permet de se prémunir contre toute fuite de données en rendant invisibles pour un opérateur humain les colonnes qui sont confidentielles. Les data scientists peuvent néanmoins continuer à travailler "normalement" avec les données "invisibles" pour créer des modèles prédictifs, des KPI’s, des agrégats, etc. Quand nous travaillons sur une donnée confidentielle pour créer des données dérivées, notre outil propage automatiquement ce niveau de confidentialité aux nouvelles données créées. Aucune autre solution ne fait ça ! Cela fait de TIMi le seul outil analytique "GDPR compliant" disponible sur le marché. Cerise sur le gâteau : TIMi est aussi une solution 100 % belge ! »