Lorsque qu’un conseiller bancaire reçoit un client en entretien commercial, il saisit dans le système d’information des commentaires sur ce dernier pour mieux le connaître et l’accompagner. Ces commentaires doivent respecter la vie privée du client et ne pas mentionner certaines informations personnelles, par exemple une maladie dont pourrait souffrir le client. Afin de s’assurer du respect des règles du Règlement Général de Protection des Données personnelles, un contrôle de niveau deux des commentaires est réalisé au siège de la banque par des experts conformité.
Ces derniers s’appuient sur une requête qui identifie les commentaires commerciaux contenant certains mots interdits. Par exemple, si un conseiller parle du cancer de son client, alors le commentaire apparait comme litigieux et doit être modifié. En revanche, le conseiller peut parler du « kancer » de son client sans que cela ressorte dans la requête. A l’inverse, lorsqu’un médecin cherche à obtenir un prêt pour lutter contre le cancer, le commentaire du conseiller, pourtant légitime, n’est pas accepté.
Pour améliorer ce fonctionnement, nous avons décidé d’expérimenter des algorithmes de Data Science. Cela devait démarrer par l’entrainement des modèles de Data Science (Machine Learning), mais nous n’avions pas les données. Certes nous disposions dans notre système d’information des commentaires commerciaux renseignés par les conseillers, mais il nous manquait l’information les qualifiant d’acceptables ou litigieux. Nos Data Scientists ont donc créée cette information sur un échantillon de commentaires en s’appuyant sur l’interprétation des règles RGPD fournie par des spécialistes (Data Protection Officer). Un « tag » a été posé sur chaque commentaire de l’échantillon pour indiquer s’il était litigieux. La donnée générée, l’entrainement pouvait débuter.
Un modèle prometteur mais qui ne marche pas du premier coup…
Malheureusement, après plusieurs itérations, le modèle s’est révélé peu performant. Nous avons alors changé de stratégie en ne travaillant plus sur la globalité des commentaires, mais uniquement sur les commentaires sans mots interdits. Cette évolution s’est révélée payante. En combinant le traitement initial des mots interdits et le modèle de Data Science, nous étions parvenus à détecter les commentaires litigieux qu’ils contiennent des mots interdits ou pas.
Un nouveau problème est alors survenu ; le volume des commentaires à contrôler était devenu trop important. Les Data Scientists ont alors entrainé un nouveau modèle se basant sur les commentaires contenant des mots interdits. Là encore, le résultat a été concluant, ce nouvel algorithme réduisant drastiquement le nombre de commentaires contenant des mots interdits.
L’iNTELIGENCE AUGMENTÉE AU SERVICE DES conseillers
Aujourd’hui, nous utilisons la requête de détection des mots interdits combinée à l’algorithme d’analyse des commentaires avec mots interdits pour aider les experts conformité à analyser les commentaires litigieux. Ce dispositif d’intelligence augmentée leur a permis de se dégager du temps pour mieux accompagner les conseillers dans la rédaction de leurs commentaires. C’est une première victoire. Cependant le comportement des conseillers évolue et l’algorithme de data science peut se dégrader. Pour éviter cela, il est important de suivre ses performances dans le temps, et de le réentraîner régulièrement en captant les retours des experts conformité qui confirment ou infirment l’avis donné par l’algorithme sur un commentaire.
Pour élaborer et maintenir un modèle de Data Science, les Data Scientists doivent expérimenter et ne rien lâcher ! Mais quelle satisfaction d’obtenir un dispositif qui in fine apporte de la valeur.