Newsroom & Medien GLEIF-Blogbeiträge
Übersetzungen dieser Website in andere Sprachen als Englisch werden von KI unterstützt. Wir garantieren keine Genauigkeit und haften nicht für Fehler oder Schäden, die sich aus der Nutzung der übersetzten Inhalte ergeben. Im Falle von Unstimmigkeiten oder Unklarheiten gilt die englische Version als maßgebend.

Wie die Banco de Portugal die Datenqualität von LEI in großem Maßstab verbessert

Ana Sofia Afonso, Data Scientist in der Abteilung Datenmanagement bei der Banco de Portugal, stellt einen praktischen Ansatz zur Aufrechterhaltung höchster Standards für die Datenqualität im großen Maßstab vor - eine Kombination aus KI-gestütztem Abgleich mit maßgeblichen nationalen Quellen und der API-gestützten Massenanforderung von GLEIF.


Autor: Ana Sofia Afonso, Datenwissenschaftlerin in der Abteilung Datenmanagement bei der Banco de Portugal

  • Datum: 2026-03-31
  • Ansichten:

Qualitativ hochwertige Legal Entity Identifier (LEI)-Daten sind der Schlüssel, um sicherzustellen, dass Organisationen auf der ganzen Welt vertrauen können und ihnen vertraut wird. Diese Qualität kann jedoch nicht durch einmalige manuelle Ad-hoc-Bereinigungen" erreicht werden, die inkonsistent, langsam und kostspielig sind. Stattdessen sind zunehmend prüfbare, wiederholbare Workflows erforderlich, die die Qualität in großem Umfang verbessern und gleichzeitig die manuellen Prozesse reduzieren.

So ist es beispielsweise eine Herausforderung zu wissen, wann eine abgelaufene LEI - die anzeigt, dass die Erneuerung nicht rechtzeitig erfolgt ist - "stillgelegt" werden sollte, um zu bestätigen, dass die juristische Person ihre Tätigkeit eingestellt hat. Wie kann dies in großem Umfang erreicht werden? Und vor allem, wie können Entscheidungen mit klaren, konsistenten und überprüfbaren Beweisen untermauert werden?

In diesem Blogbeitrag erläutert Ana Sofia Afonso, Data Scientist in der Abteilung Datenmanagement bei der Banco de Portugal, wie diese Herausforderung angegangen wurde. Durch die Kombination von maschinellem Lernen (ML) und KI-basierten Algorithmen mit strengen Qualitätskontrollen und Expertenvalidierung zur Identifizierung von LEIs, die für eine Ausmusterung in Frage kommen, wurden Datenkonsistenz und Governance in nationalen und internationalen Referenzsystemen gestärkt. Dies ist eine Blaupause dafür, wie alle LEI-Datennutzer dazu beitragen können, die Aktualität, Genauigkeit und Zuverlässigkeit des globalen LEI-Systems zu verbessern.

Verständnis von LEIs in einer nationalen Referenzdatenumgebung

In Portugal muss jede ansässige juristische Person aus rechtlichen und steuerlichen Gründen eine nationale Kennung besitzen. LEIs sind jedoch nur in bestimmten regulatorischen Kontexten obligatorisch. Infolgedessen bleibt die Gesamtabdeckung durch LEIs eher begrenzt. Darüber hinaus werden LEI-Lebenszyklusereignisse oft durch externe Berichtspflichten ausgelöst und nicht durch tatsächliche Änderungen des Rechtsstatus eines Unternehmens.

Dies stellt eine strukturelle Herausforderung dar. Da sich die nationalen Unternehmensregister weiterentwickeln, können die LEI-Daten - insbesondere für Unternehmen, die ihre Referenzdaten nicht mehr erneuern - aus dem Gleichgewicht geraten. Im Laufe der Zeit haben wir festgestellt, dass dies mehrere wiederkehrende Probleme aufwirft:

  • LEIs, die erloschen sind, nachdem die entsprechenden Unternehmen im nationalen Unternehmensregister inaktiv geworden waren;
  • Unstimmigkeiten zwischen den in GLEIF erfassten nationalen Kennungen und den von den nationalen Behörden geführten Kennungen (den Quelldaten für die Referenzdatensysteme der Banco de Portugal);
  • Die Notwendigkeit manueller Nachforschungen, die zeitaufwändig, schwer zu priorisieren und unmöglich effektiv zu skalieren waren.

Warum abgelaufene LEIs einer sorgfältigen Interpretation bedürfen

Als Antwort auf diese Herausforderungen haben wir uns auf die Suche nach einem Ansatz gemacht, der die Datenqualität über den gesamten LEI-Lebenszyklus hinweg effizient und effektiv verbessert und das Vertrauen in globale Referenzdaten stärkt.

Eine wichtige Erkenntnis aus unserer ersten Analyse war, dass eine abgelaufene LEI nicht bedeutet, dass die zugehörige juristische Person inaktiv ist. Die Nichterneuerung kann einfach eine Änderung der Meldepflichten widerspiegeln und nicht das Ende einer juristischen Person. Umgekehrt kann eine juristische Person bereits rechtlich inaktiv sein, während ihre LEI entweder erloschen oder noch vergeben ist.

Am wichtigsten ist, dass wir eine kritische Überlegung erkannt haben: Eine LEI fälschlicherweise zu löschen ist schlimmer als sie gar nicht zu löschen, da dies fälschlicherweise den Eindruck erwecken würde, dass eine juristische Person ihre Tätigkeit eingestellt hat. Infolgedessen kann die juristische Person in ihrer Fähigkeit behindert werden, Handel zu treiben oder ihre Tätigkeit allgemein auszuüben. Dies bedeutete, dass der Status "erloschen" als automatischer Auslöser für die Stilllegung ein erhebliches Governance-Risiko mit sich bringen würde und dass jede Lösung daher konservativ, evidenzbasiert und vollständig überprüfbar sein musste.

Die eigentliche Herausforderung bestand folglich darin, zu unterscheiden zwischen:
a) LEIs, die nicht erneuert wurden, aber immer noch aktiven Unternehmen entsprechen, und
b) LEIs, die mit Unternehmen verbunden sind, die in Portugal rechtlich inaktiv sind.

Unser Ansatz: KI beim Abgleich mit maßgeblichen nationalen Daten

Um diese Unterscheidung zuverlässig treffen zu können, mussten mehrere Datenquellen integriert und konsistente, evidenzbasierte Qualitätskontrollen durchgeführt werden. Unser Ansatz basierte auf einem einfachen Prinzip: LEI-Lebenszyklusentscheidungen müssen sich auf maßgebliche nationale Informationen stützen und auf kontrollierte, skalierbare Weise durchgeführt werden.

Zu diesem Zweck werden Daten aus GLEIF, externen Quellen und dem nationalen Unternehmensregister kontinuierlich in unsere Referenzdatenumgebung integriert, die einen konsolidierten Überblick über die Identität, den Rechtsstatus und den LEI-Registrierungsstatus von Unternehmen bietet. ML- und KI-basierte Algorithmen werden dann angewandt, um die Namen und Identifikatoren von Unternehmen zu standardisieren und Ähnlichkeitsbewertungen über Datensätze hinweg zu berechnen, was einen groß angelegten Abgleich von LEI-Datensätzen mit maßgeblichen nationalen Quellen ermöglicht, um festzustellen, wann Aktualisierungen erforderlich sind.

Nach der Validierung werden die Aktualisierungen dann über die API-fähige Massenanforderung von GLEIF operationalisiert, was den manuellen Aufwand erheblich reduziert und unsere internen Prozesse rationalisiert. Gleichzeitig bietet diese Einrichtung eine zusätzliche Sicherheit, da sie die Validierung der Informationen durch unabhängige Dritte ermöglicht. Dadurch wird sichergestellt, dass verifizierte LEI-Abgänge konsistent, effizient und mit vollständiger Rückverfolgbarkeit verarbeitet werden, während gleichzeitig unnötige Ad-hoc- oder manuelle Eingriffe vermieden werden.

Es ist auch wichtig zu erwähnen, dass während des gesamten Arbeitsablaufs die menschliche Aufsicht unerlässlich bleibt. Komplexe oder zweideutige Fälle werden zur Überprüfung durch Experten weitergeleitet, um sicherzustellen, dass die Automatisierung die Governance stärkt, anstatt sie zu ersetzen.

Die Ergebnisse: Von reaktiven Ermittlungen zu kontrollierten Prozessen

Die Anwendung dieses Ansatzes führte zu klaren, messbaren Ergebnissen.

Erstens identifizierten wir LEIs, die tatsächlich für eine Ausmusterung in Frage kamen, und zwar auf der Grundlage verifizierter rechtlicher Inaktivität und nicht allein aufgrund des Verlängerungsverhaltens.

Zweitens haben wir eine beträchtliche Anzahl von Datenqualitätsproblemen aufgedeckt, die nichts mit der Ausbuchung zu tun haben, insbesondere in Bezug auf die Genauigkeit der Kennung. Die Behebung dieser Diskrepanzen verbesserte die allgemeine Übereinstimmung zwischen den nationalen Referenzdatenbanken und den GLEIF-Datensätzen.

Drittens zeigte unsere Längsschnittanalyse des LEI-Registrierungsstatus, dass die Zunahme abgelaufener und stillgelegter LEIs eher die Dynamik des Lebenszyklus der Unternehmen widerspiegelt als eine systematische Datenverschlechterung. Die Einbeziehung dieser zeitlichen Dimension erwies sich als wesentlich für die korrekte Interpretation der Daten.

Schließlich gingen wir von manuellen Ad-hoc-Untersuchungen zu wiederholbaren, überprüfbaren Arbeitsabläufen über, die sich auf klare Kriterien und dokumentierte Ergebnisse stützen, wodurch sowohl die Konsistenz als auch die Governance verbessert wurden.

Verbesserung der Datenqualität im gesamten globalen LEI-System

Abgesehen von den erheblichen operativen Vorteilen, die sich daraus ergeben, steht dieser Ansatz für unser starkes Engagement für das Global LEI System. Durch die zeitnahe Weitergabe von Informationen und die Aktualisierung von LEI-Referenzdaten außerhalb des Standard-Erneuerungszyklus tragen wir aktiv dazu bei, die höchsten Datenqualitätsstandards aufrechtzuerhalten und sicherzustellen, dass die LEI-Referenzdaten korrekt und auf dem neuesten Stand bleiben. Dies spielt eine entscheidende Rolle bei der Förderung von Vertrauen und Transparenz in der portugiesischen Wirtschaft und darüber hinaus.

Danksagungen

Diese Arbeit ist das Ergebnis einer gemeinschaftlichen Teamarbeit, die das Wissen, die Erfahrung und die Perspektiven mehrerer Beteiligter vereint, deren gemeinsame Bemühungen dieses Ergebnis möglich gemacht haben. Ich möchte allen Beteiligten, deren Diskussionen, Rückmeldungen und Engagement für die Entwicklung dieser Arbeit von grundlegender Bedeutung waren, meinen aufrichtigen Dank aussprechen, wobei ich Maria do Carmo Moreno und Bruno Gonçalo Tenório besonders erwähnen möchte. Die in dieser Arbeit geäußerten Ansichten geben nicht unbedingt die der Institutionen wieder und sind ausschließlich als Interpretation und Analyse des Themas durch die Autoren zu verstehen.

Falls Sie einen Blogbeitrag kommentieren möchten, besuchen Sie zum Posten Ihres Kommentars bitte die Blog-Funktion auf der englischsprachigen GLEIF-Website. Bitte identifizieren Sie sich mit Ihrem Vor- und Nachnamen. Ihr Name erscheint neben Ihrem Kommentar. Die E-Mail-Adresse wird nicht veröffentlicht. Bitte beachten Sie, dass Sie sich durch Zugriff auf oder Beiträge zum Diskussionsforum verpflichten, die Bedingungen der GLEIF-Blogging-Richtlinie einzuhalten. Lesen Sie sich diese daher sorgfältig durch.



Alle vorherigen GLEIF-Blog-Postings lesen >
Über den Autor:

Ana Sofia Afonso ist Data Scientist in der Abteilung Datenmanagement bei der Banco de Portugal. Sie hat einen Master of Science in Finanzwissenschaften. Ana Sofia ist auf die Umwandlung komplexer, fragmentierter Daten in verlässliche Erkenntnisse für die Statistikproduktion und Strategie spezialisiert. Ihre Arbeit umfasst Python und SQL, Datenpipelines, Analytik und Visualisierung sowie zunehmend fortgeschrittene Statistik, maschinelles Lernen, Feature Engineering und moderne Data-Engineering-Praktiken zur Verbesserung der Modellqualität, Workflow-Effizienz und Datenzuverlässigkeit.


Tags für diesen Artikel:
Datenverwaltung, Datenqualität, Open Data, Global LEI Index, Legal Entity Identifier (LEI), Global Legal Entity Identifier Foundation (GLEIF)