Les traductions de ce site web dans des langues autres que l'anglais sont générées par l'IA. Nous ne garantissons pas l'exactitude et ne sommes pas responsables des erreurs ou dommages résultant de l'utilisation du contenu traduit. En cas d'incohérences ou d'ambiguïtés, la version anglaise prévaut.
Salle des nouvelles & Médias
Le blog de la GLEIF
Les traductions de ce site web dans des langues autres que l'anglais sont générées par l'IA. Nous ne garantissons pas l'exactitude et ne sommes pas responsables des erreurs ou dommages résultant de l'utilisation du contenu traduit. En cas d'incohérences ou d'ambiguïtés, la version anglaise prévaut.
Comment Banco de Portugal renforce la Qualité des données LEI à l'échelle
Ana Sofia Afonso, Data Scientist à la Division de la gestion des données de Banco de Portugal, partage une approche pratique pour maintenir les normes de qualité des données les plus élevées à l'échelle - en combinant la vérification croisée basée sur l'IA contre des sources nationales faisant autorité avec la facilité de contestation en vrac basée sur l'API de GLEIF.
Auteur: Ana Sofia Afonso, Data Scientist au sein de la Division de la gestion des données à la Banco de Portugal
Date: 2026-03-31
Vues:
Des données d'Identifiant d'entité légale (LEI) de haute qualité sont essentielles pour garantir que les organisations à l'échelle mondiale peuvent faire confiance et être dignes de confiance. Cependant, cette qualité ne peut pas être obtenue par des "nettoyages" manuels ad hoc et ponctuels qui sont incohérents, lents et coûteux. Au contraire, elle exige de plus en plus des flux de travail vérifiables et reproductibles, conçus pour améliorer la qualité à grande échelle tout en réduisant les processus manuels.
Prenons la Contestation de savoir quand un LEI expiré - qui indique que le renouvellement n'a pas eu lieu à temps - doit être " retiré " pour confirmer que l'entité légale a cessé ses activités. Comment y parvenir à grande échelle ? Et, surtout, comment les décisions peuvent-elles être étayées par des preuves claires, cohérentes et vérifiables ?
Dans ce billet de blog, Ana Sofia Afonso, Data Scientist au sein de la division Gestion des données de Banco de Portugal, explique comment cette Contestation a été relevée. En combinant des algorithmes basés sur l'apprentissage automatique (ML) et l'IA avec des contrôles de qualité rigoureux et une validation par des experts pour identifier les LEI éligibles à la retraite, elle a renforcé la cohérence des données et la Gouvernance à travers les systèmes de référence nationaux et internationaux. Cela offre un schéma directeur décrivant comment tous les utilisateurs de données LEI peuvent contribuer à améliorer l'actualité, la précision et la fiabilité dans l'ensemble du système Global LEI.
Comprendre les LEI dans un environnement de données de référence nationales
Au Portugal, toute entité légale résidente doit détenir un identifiant national à des fins juridiques et fiscales. Toutefois, les LEI ne sont obligatoires que dans des contextes réglementaires spécifiques. Par conséquent, la couverture globale des LEI reste plus limitée. En outre, les événements du cycle de vie du LEI sont souvent déclenchés par des obligations d'information externes plutôt que par des changements réels dans le statut juridique d'une entité.
Il en résulte une Contestation structurelle. Au fur et à mesure que les registres nationaux des activités économiques évoluent, les données du LEI - en particulier pour les entités qui cessent de renouveler leurs données de référence - peuvent se désynchroniser. Au fil du temps, nous avons observé que cette situation posait plusieurs problèmes récurrents :
Des LEI restés expirés après que les entités correspondantes soient devenues inactives dans le registre national des entreprises ;
Des incohérences entre les identifiants nationaux enregistrés dans le GLEIF et ceux détenus par les autorités nationales (les données sources des systèmes de données de référence de la Banco de Portugal) ;
La nécessité de mener des enquêtes manuelles qui prenaient beaucoup de temps, qu'il était difficile de classer par ordre de priorité et qu'il était impossible d'étendre efficacement.
Pourquoi les LEI expirés nécessitent une interprétation prudente ?
En réponse à ces contestations, nous avons entrepris d'explorer une approche permettant d'améliorer efficacement la qualité des données tout au long du cycle de vie des LEI et de renforcer la confiance dans les données de référence mondiales.
L'une des principales conclusions de notre analyse initiale est qu'une LEI expirée ne signifie pas que l'entité légale associée est inactive. Le non-renouvellement peut simplement refléter un changement dans les obligations de déclaration plutôt que la cessation d'activité d'une entité légale. Inversement, une entité peut déjà être juridiquement inactive alors que sa LEI est soit expirée, soit encore émise.
Plus important encore, nous avons reconnu une considération essentielle : retirer incorrectement un LEI est pire que de ne pas le retirer du tout, car cela donnerait l'impression erronée qu'une entité légale a cessé ses activités. En conséquence, l'entité peut être gênée dans sa capacité à commercer ou à exercer ses activités de manière plus générale. Cela signifie que le fait de s'appuyer sur le statut "caduc" comme déclencheur automatique du retrait introduirait un risque important en matière de Gouvernance, et que toute solution devait donc être prudente, fondée sur des preuves et entièrement contrôlable.
Par conséquent, la véritable Contestation a consisté à faire la distinction entre :
a) les LEI qui n'ont pas été renouvelées mais qui correspondent toujours à des entités actives, et
b) les LEI associées à des entités légalement inactives au Portugal.
Notre approche : L'IA dans la vérification croisée avec les données nationales faisant autorité
Pour parvenir à cette distinction de manière fiable, il fallait intégrer de multiples sources de données et appliquer des contrôles de qualité cohérents et fondés sur des preuves. Notre approche s'articule autour d'un principe simple : Les décisions relatives au cycle de vie des LEI doivent s'appuyer sur des informations nationales faisant autorité et être exécutées de manière contrôlée et évolutive.
Pour ce faire, les données du GLEIF, des sources externes et du registre national des entreprises sont intégrées en continu dans notre environnement de données de référence, offrant une vue consolidée de l'identité de l'entité, de son statut juridique et du statut d'enregistrement du LEI. Des algorithmes basés sur le ML et l'IA sont ensuite appliqués pour normaliser les noms et les identifiants des entités et pour calculer les scores de similarité entre les ensembles de données, ce qui permet une vérification croisée à grande échelle des enregistrements LEI par rapport aux sources nationales faisant autorité, afin d'identifier quand des mises à jour sont nécessaires.
Une fois validées, les mises à jour sont rendues opérationnelles par le biais de l'API du GLEIF, qui permet de réduire considérablement les efforts manuels et de rationaliser nos processus internes. Dans le même temps, le dispositif ajoute une couche supplémentaire d'assurance en permettant la validation des informations par une tierce partie indépendante. Cela garantit que les retraits de LEI vérifiés sont traités de manière cohérente, efficace et avec une traçabilité complète, tout en évitant les interventions ad hoc ou manuelles inutiles.
Il est également important de noter que, tout au long du flux de travail, la supervision humaine reste essentielle. Les cas complexes ou ambigus sont remontés pour être examinés par des experts, ce qui garantit que l'automatisation renforce la Gouvernance au lieu de la remplacer.
Les résultats : Des enquêtes réactives à des processus contrôlés
L'application de cette approche a donné des résultats clairs et mesurables.
Tout d'abord, nous avons identifié des LEI réellement éligibles au retrait, sur la base d'une inactivité juridique vérifiée plutôt que sur le seul comportement de renouvellement.
Deuxièmement, nous avons découvert un nombre important de problèmes de qualité des données sans rapport avec le retrait, notamment en ce qui concerne l'exactitude des identifiants. La résolution de ces divergences a permis d'améliorer l'alignement global entre les bases de données de référence nationales et les enregistrements GLEIF.
Troisièmement, notre analyse longitudinale du statut d'enregistrement des LEI a montré que l'augmentation des LEI expirés et retirés reflétait largement la dynamique du cycle de vie des entités authentiques plutôt qu'une dégradation systémique des données. L'intégration de cette dimension temporelle s'est avérée essentielle pour interpréter correctement les données.
Enfin, nous sommes passés d'enquêtes manuelles ad hoc à des flux de travail reproductibles et vérifiables, soutenus par des critères clairs et des résultats documentés, renforçant ainsi la cohérence et la Gouvernance.
Amélioration de la qualité des données dans l'ensemble du système LEI mondial
Au-delà des avantages opérationnels significatifs réalisés, cette approche représente notre engagement fort envers le système Global LEI. En partageant les informations en temps opportun et en mettant à jour les données de référence du LEI en dehors du cycle de renouvellement standard, nous contribuons activement à maintenir les normes les plus élevées en matière de qualité des données et à garantir que les données de référence du LEI restent exactes et à jour. Cela joue un rôle crucial dans la promotion de la confiance et de la transparence dans l'économie portugaise et au-delà.
Remerciements
Ce travail est le résultat d'un travail d'équipe collaboratif, combinant les connaissances, l'expérience et les perspectives de plusieurs contributeurs dont les efforts conjoints ont rendu ce résultat possible. Je tiens à exprimer ma sincère gratitude à toutes les personnes impliquées dans le processus, dont les discussions, les commentaires et le dévouement ont été fondamentaux pour l'élaboration de ce travail, avec une mention spéciale pour Maria do Carmo Moreno et Bruno Gonçalo Tenório. Les opinions exprimées dans ce travail ne représentent pas nécessairement celles des institutions et doivent être comprises uniquement comme l'interprétation et l'analyse du sujet par les auteurs.
Si vous souhaitez commenter une publication sur le blog, veuillez vous identifier à l'aide de votre prénom et de votre nom. Votre nom apparaîtra à côté de votre commentaire. Aucune adresse e-mail ne sera publiée. Veuillez noter qu'en accédant ou en contribuant au forum de discussion, vous acceptez de respecter les conditions de la Politique de la GLEIF en matière de blog ; veuillez donc les lire attentivement.
Ana Sofia Afonso est data scientist au sein de la division Gestion des données de Banco de Portugal. Elle est titulaire d'un Master of Science en finance. Ana Sofia est spécialisée dans la conversion de données complexes et fragmentées en informations fiables pour la production statistique et la stratégie. Son travail couvre Python et SQL, les pipelines de données, l'analyse et la visualisation, et des statistiques de plus en plus avancées, l'apprentissage automatique, l'ingénierie des fonctionnalités et les pratiques modernes d'ingénierie des données pour améliorer la qualité des modèles, l'efficacité du flux de travail et la fiabilité des données.