Newsroom e media Blog della GLEIF
Le traduzioni di questo sito web in lingue diverse dall'inglese sono generate dall'IA. Non garantiamo l'accuratezza e non siamo responsabili per eventuali errori o danni derivanti dall'uso del contenuto tradotto. In caso di incongruenze o ambiguità, la versione inglese prevarrà.

Come il Banco de Portugal rafforza la qualità dei dati LEI su larga scala

Ana Sofia Afonso, Data Scientist della Divisione Gestione dei dati del Banco de Portugal, condivide un approccio pratico per mantenere i più elevati standard di qualità dei dati su scala, combinando il controllo incrociato basato sull'intelligenza artificiale con fonti nazionali autorevoli e la funzione di sfida massiva di GLEIF basata su API.


Autore: Ana Sofia Afonso, Data Scientist presso la Divisione Gestione dei dati del Banco de Portugal

  • Data: 2026-03-31
  • Visualizzazioni:

La qualità dei dati dell'Identificativo della Persona giuridica (LEI) è fondamentale per garantire la fiducia e l'affidabilità delle organizzazioni a livello globale. Tuttavia, questa qualità non può essere raggiunta attraverso "pulizie" manuali ad hoc, una tantum, che sono incoerenti, lente e costose. Al contrario, richiede sempre più flussi di lavoro ripetibili e verificabili, progettati per migliorare la qualità su scala e ridurre i processi manuali.

Prendiamo ad esempio la sfida di sapere quando un Codici LEI scaduti, che indica che il rinnovo non è avvenuto nei tempi previsti, deve essere "ritirato" per confermare che la Persona giuridica ha cessato l'attività. Come si può ottenere questo risultato su scala? E, soprattutto, come supportare le decisioni con prove chiare, coerenti e verificabili?

In questo post Ana Sofia Afonso, Data Scientist della Divisione Gestione dei dati del Banco de Portugal, spiega come è stata affrontata questa sfida. Combinando l'apprendimento automatico (ML) e gli algoritmi basati sull'intelligenza artificiale con rigorosi controlli di qualità e la convalida di esperti per identificare i LEI idonei al pensionamento, ha rafforzato la coerenza e la governance dei dati nei sistemi di riferimento nazionali e internazionali. Ciò offre un'idea di come tutti gli utenti dei dati LEI possano contribuire ad aumentare la tempestività, l'accuratezza e l'affidabilità del sistema LEI globale.

Capire i LEI in un ambiente di dati di riferimento nazionale

In Portogallo, ogni persona giuridica residente deve possedere un identificativo nazionale a fini legali e fiscali. I LEI, tuttavia, sono obbligatori solo in contesti normativi specifici. Di conseguenza, la copertura complessiva dei LEI rimane più limitata. Inoltre, gli eventi del ciclo di vita dei LEI sono spesso innescati da obblighi di rendicontazione esterna piuttosto che da effettivi cambiamenti nello status giuridico di un'entità.

Questo crea una sfida strutturale. Con l'evoluzione dei registri nazionali delle imprese, i dati LEI - in particolare per le entità che smettono di rinnovare i propri dati di riferimento - possono non essere sincronizzati. Nel corso del tempo, abbiamo osservato che ciò presenta diversi problemi ricorrenti:

  • Codici LEI scaduti dopo che le entità corrispondenti erano diventate inattive nel registro nazionale delle imprese;
  • Incoerenze tra gli identificatori nazionali registrati nel GLEIF e quelli in possesso delle autorità nazionali (la fonte dei dati di riferimento del Banco de Portugal);
  • La necessità di effettuare indagini manuali che richiedevano molto tempo, erano difficili da classificare e non potevano essere scalate in modo efficace.

Perché i Codici LEI scaduti richiedono un'interpretazione accurata

In risposta a queste sfide, abbiamo deciso di esplorare un approccio per migliorare in modo efficiente ed efficace la qualità dei dati nel ciclo di vita dei LEI e rafforzare la fiducia nei dati di riferimento globali.

L'analisi iniziale ha evidenziato che un Codici LEI scaduti non significa che la Persona giuridica associata sia inattiva. Il mancato rinnovo può semplicemente riflettere un cambiamento negli obblighi di rendicontazione piuttosto che la cessazione di un'entità giuridica. Al contrario, un'entità può già essere legalmente inattiva mentre il suo LEI è scaduto o ancora rilasciato.

Soprattutto, abbiamo riconosciuto una considerazione critica: ritirare un LEI in modo errato è peggio che non ritirarlo affatto, in quanto potrebbe dare l'impressione errata che un'entità giuridica abbia cessato l'attività. Di conseguenza, l'entità potrebbe essere ostacolata nella sua capacità di commerciare o di svolgere le sue operazioni più in generale. Ciò significa che affidarsi allo status di "decaduto" come trigger automatico per il pensionamento introdurrebbe un significativo rischio di governance e che qualsiasi soluzione, quindi, deve essere conservativa, basata su prove e completamente verificabile.

Di conseguenza, la vera sfida è stata quella di distinguere tra:
a) LEI che non sono stati rinnovati ma che corrispondono ancora a entità attive e
b) LEI associati a entità legalmente inattive in Portogallo.

Il nostro approccio: L'intelligenza artificiale nel controllo incrociato con i dati nazionali autorevoli

Per ottenere questa distinzione in modo affidabile è stato necessario integrare più fonti di dati e applicare controlli di qualità coerenti e basati su prove. Il nostro approccio si basa su un semplice principio: Le decisioni relative al ciclo di vita dei LEI devono basarsi su informazioni nazionali autorevoli ed essere eseguite in modo controllato e scalabile.

A tal fine, i dati provenienti da GLEIF, da fonti esterne e dal registro nazionale delle imprese vengono continuamente integrati nel nostro ambiente di dati di riferimento, fornendo una visione consolidata dell'identità dell'entità, dello stato giuridico e dello stato di registrazione LEI. Algoritmi basati su ML e AI vengono poi applicati per standardizzare i nomi e gli identificatori delle entità e per calcolare i punteggi di somiglianza tra i vari set di dati, consentendo un controllo incrociato su larga scala dei record LEI rispetto alle fonti nazionali autorevoli per identificare quando è necessario un aggiornamento.

Una volta convalidati, gli aggiornamenti vengono resi operativi attraverso il sistema di contestazione in blocco API di GLEIF, che riduce significativamente lo sforzo manuale e snellisce i processi interni. Allo stesso tempo, la struttura aggiunge un ulteriore livello di garanzia consentendo la convalida delle informazioni da parte di terzi indipendenti. Ciò garantisce che i ritiri LEI verificabili siano elaborati in modo coerente, efficiente e con piena tracciabilità, evitando inutili interventi manuali o ad hoc.

È inoltre importante notare che in tutto il flusso di lavoro la supervisione umana rimane essenziale. I casi complessi o ambigui vengono sottoposti alla revisione di esperti, assicurando che l'automazione rafforzi la governance piuttosto che sostituirla.

I risultati: Da indagini reattive a processi controllati

L'applicazione di questo approccio ha prodotto risultati chiari e misurabili.

In primo luogo, abbiamo identificato i LEI realmente idonei al pensionamento, sulla base dell'inattività legale verificata piuttosto che del solo comportamento di rinnovo.

In secondo luogo, abbiamo individuato un numero considerevole di problemi di qualità dei dati non legati al pensionamento, in particolare per quanto riguarda l'accuratezza degli identificatori. La risoluzione di queste discrepanze ha migliorato l'allineamento complessivo tra i database nazionali di riferimento e i record GLEIF.

In terzo luogo, la nostra analisi longitudinale dello stato di registrazione dei LEI ha mostrato che l'aumento dei Codici LEI scaduti e ritirati riflette in gran parte le dinamiche del ciclo di vita delle entità piuttosto che il degrado sistemico dei dati. L'incorporazione di questa dimensione temporale si è rivelata essenziale per interpretare correttamente i dati.

Infine, siamo passati da indagini manuali ad hoc a flussi di lavoro ripetibili e verificabili, supportati da criteri chiari e risultati documentati, rafforzando la coerenza e la governance.

Miglioramento della qualità dei dati in tutto il sistema LEI globale

Oltre ai significativi vantaggi operativi realizzati, questo approccio rappresenta il nostro forte impegno nei confronti del Sistema LEI globale. Condividendo le informazioni in modo tempestivo e aggiornando i dati di riferimento LEI al di fuori del ciclo di rinnovo standard, contribuiamo attivamente a mantenere i più elevati standard di qualità dei dati e a garantire che i dati di riferimento LEI rimangano accurati e aggiornati. Ciò svolge un ruolo fondamentale nel promuovere la fiducia e la trasparenza nell'economia portoghese e non solo.

Riconoscimenti

Questo lavoro è il risultato di un lavoro di squadra, che unisce le conoscenze, l'esperienza e le prospettive di diversi collaboratori, i cui sforzi congiunti hanno reso possibile questo risultato. Desidero esprimere la mia sincera gratitudine a tutti coloro che hanno partecipato al processo, le cui discussioni, feedback e dedizione sono stati fondamentali per lo sviluppo di questo lavoro, con una menzione speciale a Maria do Carmo Moreno e Bruno Gonçalo Tenório. Le opinioni espresse in questo lavoro non rappresentano necessariamente quelle delle istituzioni e devono essere intese esclusivamente come interpretazione e analisi dell'argomento da parte degli autori.

Per commentare un articolo del blog, indicate il vostro nome e cognome. Il nome e il cognome verranno visualizzati accanto al commento. Gli indirizzi e-mail non verranno pubblicati. Effettuando l’accesso o contribuendo al forum di discussione, l’utente accetta i termini della Politica in materia di blog della GLEIF. Si invita pertanto l’utente a leggere tale politica con attenzione.



Leggi tutti gli articoli precedenti sul Blog della GLEIF >
Informazioni sull’autore:

Ana Sofia Afonso è Data Scientist presso la Divisione Gestione dei dati del Banco de Portugal. Ha conseguito un Master in Finanza. Ana Sofia è specializzata nella conversione di dati complessi e frammentati in approfondimenti affidabili per la produzione statistica e la strategia. Il suo lavoro spazia tra Python e SQL, pipeline di dati, analisi e visualizzazione e statistiche sempre più avanzate, machine learning, feature engineering e moderne pratiche di data engineering per migliorare la qualità dei modelli, l'efficienza del flusso di lavoro e l'affidabilità dei dati.


Tag di questo articolo:
Gestione dei dati, Qualità dei dati, Dati aperti, Indice globale di codici LEI, Identificativo della persona giuridica (LEI), Global Legal Entity Identifier Foundation (GLEIF)