Rapprochements comptables, contrôles de montants déclarés à l’administration fiscale, tests en audit interne ou contrôle permanent : de nombreuses tâches opérées au sein des fonctions supports des compagnies d’assurance consistent à réconcilier des données issues de sources différentes. Cela revient à retrouver la même information à deux endroits distincts. La bonne nouvelle, c’est que la digitalisation a conduit tous les acteurs de la finance à concevoir des systèmes dédiés. La mauvaise, c’est que ces systèmes sont dédiés, c’est-à-dire conçus en vue d’un usage particulier et propre à une fonction : élaboration de la comptabilité, suivi des engagements, pilotage du portefeuille, gestion des polices d’assurance… Et que réconcilier ou rapprocher, ça revient à les faire parler ensemble. Ce qui n’a parfois rien d’évident.
Nos consultants ont tiré de leur expérience en mission une approche et des conseils pratiques pour résoudre le casse-tête que constitue souvent la réconciliation de données.
Réconciliation de données : une opération simple en théorie, mais en pratique…
Du fait de l’effet de silotage entre systèmes, la réconciliation de données revient à faire dialoguer deux bases de données totalement distinctes. Les exemples que nous rencontrons le plus fréquemment concernent la comptabilité, où il s’agit par exemple de rapprocher les opérations sur les contrats clients (rachats, modifications de primes…) de leur pendant en comptabilité, avec des dates d’enregistrement différentes et des mailles d’agrégation dictées par l’usage de la donnée initiale (que celui qui ne s’est jamais plaint d’avoir reçu une donnée agrégée / à la mauvaise maille me jette le premier disque dur). Il s’ensuit que la réconciliation entre deux tableaux de chiffres passe bien souvent par de multiples étapes de transformations plus ou moins manuelles afin de parvenir à obtenir les mêmes lignes des deux côtés.
Prenons un exemple.
Dans cet exemple, il va falloir reconstruire les primes nettes agrégées dans le premier tableau. Dans le second tableau, il va falloir identifier les garanties associées à chaque compte, mais également calculer les agrégats par an, par garantie et par contrat.
A cette difficulté de jongler entre différents systèmes est venue s’en ajouter une autre : les volumes toujours plus imposants de données. Le principal obstacle devient alors technique puisque nos espaces de partage et tableurs favoris trouvent généralement là leurs limites en termes de capacités, quand il ne s’agit pas de nos connexions domestiques, fortement sollicitées en télétravail.
La réconciliation est un processus de génération de données
Il est possible de surmonter durablement ces obstacles : puisque les réconciliations se trouvent dans la zone de frottement entre deux processus, repensons-les comme des processus à part entière, en particulier comme des processus dont la sortie est une donnée. De manière très simplifiée, on peut voir un rapprochement comptable comme un processus dont l’entrée est constituée de deux tableaux sous forme d’extractions des différents systèmes à comparer et dont la sortie est une donnée calculée ligne à ligne dont on espère qu’elle sera égale à 0. On peut donc le considérer comme une succession de tâches de transformation des données d’entrées hétérogènes brutes dans un but précis : suivre, corriger et justifier les écarts de comptabilité. Repenser son rapprochement revient donc à une analyse de processus, soit un exercice relativement classique dans les projets de transformation.
Un processus de génération de données… c’est donc de la data !
Mais ce processus, on l’a dit, est un processus de production de données, soit un type très particulier de processus… qui se trouve être au cœur de la science des données. Si vous discutez avec un data scientist, il vous parlera peut-être de modèles avancés, d’IA… mais il vous évoquera plus certainement les opérations d’unification, de nettoyage, de traitement de la donnée qui occupent 80% de son temps. Cette méthode de travail est commune à tous les problèmes de données, et conduit à présenter la data science non sous l’angle d’un résultat, mais comme un processus à appliquer à la matière première que constituent les données. Et si le modèle appliqué en bout de processus consiste en une simple soustraction entre deux colonnes, la méthode n’en est pas moins applicable et performante. Un problème de réconciliation de données est un problème de data science comme un autre. Et toutes les méthodes permettant d’accélérer le processus et de le systématiser pour le rendre moins urticant sont applicables.
Un processus bien connu des data scientists
Dans notre exemple, le processus peut être schématisé ainsi :
Les quatre conseils à retenir pour des réconciliations zen
- Autant que possible, travailler sur les étapes les plus en amont du processus de production de données, ce qui implique notamment de faire converger les sources vers un format unique cible.
- Adopter une vision processus qui permettra de créer le pipeline de données. Le pipeline, c’est la vision « données » du processus, soit la succession des opérations / tâches à réaliser.
- Dessiner le pipeline permettra de transposer immédiatement et facilement le processus dans l’outil analytique choisi. Pour un processus répété régulièrement, un outil de Business Intelligence comme Knime pourra être utilement mis en place et le flux conçu sera alors exécuté automatiquement. Pour des usages plus tactiques, notamment à fins d’audit interne, il peut être plus utile de viser à s’approprier la conception de pipelines afin de les concevoir ad hoc.
- La data science, ce n’est pas que l’IA ou de l’analytics avancé. Une partie des outils et méthodes utilisés par les data scientists sont parfaitement adaptés à la réduction des irritants que peuvent constituer les opérations de réconciliations de données. Alors n’hésitez pas à faire appel à eux !