Sala de prensa y Medios Blog de la GLEIF
Las traducciones de este sitio web a otros idiomas distintos del inglés se realizan mediante IA. No garantizamos la exactitud y no somos responsables de los errores o daños derivados del uso del contenido traducido. En caso de incoherencias o ambigüedades, la versión inglesa prevalecerá.

Cómo refuerza el Banco de Portugal la Calidad de datos del IPJ a escala

Ana Sofia Afonso, Científica de Datos de la División de Gestión de datos del Banco de Portugal, comparte un enfoque práctico para mantener los más altos Estándares de calidad de datos a escala, combinando la verificación cruzada habilitada por IA con fuentes nacionales autorizadas y el servicio de impugnación masiva habilitado por API de la GLEIF.


Autor: Ana Sofia Afonso, Científica de Datos en la División de Gestión de datos del Banco de Portugal

  • Fecha: 2026-03-31
  • Visualizaciones:

Los datos del Identificador de Entidad Legal (IPJ) de alta calidad son fundamentales para garantizar que las organizaciones de todo el mundo puedan confiar y ser de confianza. Sin embargo, esta calidad no puede lograrse mediante "limpiezas" manuales ad hoc y puntuales que son incoherentes, lentas y costosas. Por el contrario, exige cada vez más flujos de trabajo auditables y repetibles, diseñados para mejorar la calidad a escala y reducir los procesos manuales.

Por ejemplo, la Impugnación de saber cuándo un IPJ caducado -que indica que la renovación no se ha producido a tiempo- debe "retirarse" para confirmar que la persona jurídica ha dejado de operar. ¿Cómo puede conseguirse esto a gran escala? Y, sobre todo, ¿cómo pueden respaldarse las decisiones con pruebas claras, coherentes y verificables?

En esta entrada del blog, Ana Sofia Afonso, científica de datos de la División de Gestión de datos del Banco de Portugal, explica cómo se abordó esta Impugnación. Mediante la combinación de algoritmos basados en el aprendizaje automático (ML) y la IA con rigurosos controles de calidad y la validación de expertos para identificar los IPJ que cumplen los requisitos para ser retirados, se reforzó la coherencia y la Gobernanza de los datos en todos los sistemas de referencia nacionales e internacionales. Esto ofrece un modelo que describe cómo todos los usuarios de datos del IPJ pueden ayudar a aumentar la puntualidad, la precisión y la fiabilidad en todo el Sistema Global del IPJ.

Comprensión de los IPJ en un entorno de datos de referencia nacional

En Portugal, todas las personas jurídicas residentes deben poseer un identificador nacional a efectos jurídicos y fiscales. Sin embargo, los IPJ sólo son obligatorios en contextos normativos específicos. En consecuencia, la cobertura global del IPJ sigue siendo más limitada. Además, los eventos del ciclo de vida del IPJ a menudo se desencadenan por obligaciones de información externas y no por cambios reales en la personalidad jurídica de una entidad.

Esto crea una Impugnación estructural. A medida que evolucionan los registros mercantiles nacionales, los datos del IPJ -en particular los de las entidades que dejan de renovar sus datos de referencia- pueden quedar desfasados. Con el tiempo, hemos observado que esto presenta varios problemas recurrentes:

  • IPJ que permanecen caducados después de que las entidades correspondientes hayan pasado a estar inactivas en el registro mercantil nacional;
  • Inconsistencias entre los identificadores nacionales registrados en la GLEIF y los que obran en poder de las autoridades nacionales (los datos fuente de los sistemas de datos de referencia del Banco de Portugal);
  • La necesidad de realizar investigaciones manuales que llevaban mucho tiempo, eran difíciles de priorizar e imposibles de escalar eficazmente.

Por qué los LEI caducados requieren una interpretación cuidadosa

En respuesta a estos retos, nos propusimos explorar un enfoque para mejorar de forma eficiente y eficaz la calidad de los datos en todo el ciclo de vida del IPJ y reforzar la confianza en los datos de referencia globales.

Una idea clave de nuestro análisis inicial fue que un IPJ caducado no significa que la persona jurídica asociada esté inactiva. La no renovación puede reflejar simplemente un cambio en las obligaciones de información y no la extinción de una persona jurídica. Por el contrario, una persona jurídica puede estar legalmente inactiva mientras su IPJ esté caducado o aún emitido.

Y lo que es más importante, reconocimos una consideración crítica: retirar un IPJ de forma incorrecta es peor que no retirarlo en absoluto, ya que daría la impresión errónea de que una persona jurídica ha cesado sus actividades. Como consecuencia, la entidad puede ver obstaculizada su capacidad para comerciar o llevar a cabo sus operaciones de forma más general. Esto significaba que confiar en el estatus de "caducado" como desencadenante automático de la retirada introduciría un riesgo de Gobernanza significativo, y que cualquier solución, por lo tanto, necesitaba ser conservadora, basada en pruebas y totalmente auditable.

En consecuencia, la verdadera Impugnación consistía en distinguir entre:
a) los IPJ que no se habían renovado pero que seguían correspondiendo a entidades activas, y
b) IPJ asociados a entidades legalmente inactivas en Portugal.

Nuestro enfoque: IA en la comprobación cruzada con datos nacionales autorizados

Para lograr esta distinción de forma fiable fue necesario integrar múltiples fuentes de datos y aplicar controles de calidad coherentes y basados en pruebas. Nuestro enfoque se basó en un principio sencillo: Las decisiones sobre el ciclo de vida del IPJ deben basarse en información nacional fidedigna y ejecutarse de forma controlada y escalable.

Para ello, los datos de la GLEIF, las fuentes externas y el registro mercantil nacional se integran continuamente en nuestro entorno de datos de referencia, proporcionando una visión consolidada de la identidad de la entidad, la condición jurídica y el estado de inscripción del IPJ. A continuación, se aplican algoritmos basados en inteligencia artificial para normalizar los nombres e identificadores de las entidades y para calcular las puntuaciones de similitud entre los conjuntos de datos, lo que permite realizar comprobaciones cruzadas a gran escala de los registros del IPJ con fuentes nacionales autorizadas para identificar cuándo es necesario realizar actualizaciones.

Una vez validadas, las actualizaciones se ponen en marcha a través del servicio de impugnación masiva habilitado para API de la GLEIF, que reduce significativamente el esfuerzo manual y agiliza nuestros procesos internos. Al mismo tiempo, el servicio añade un nivel adicional de garantía al permitir la validación de la información por parte de terceros independientes. Esto garantiza que las bajas del IPJ verificadas se procesen de forma coherente, eficiente y con total trazabilidad, al tiempo que se evitan intervenciones ad hoc o manuales innecesarias.

También es importante señalar que en todo el flujo de trabajo, la supervisión humana sigue siendo esencial. Los casos complejos o ambiguos se someten a la revisión de expertos, lo que garantiza que la automatización refuerza la Gobernanza en lugar de sustituirla.

Los resultados: De investigaciones reactivas a procesos controlados

La aplicación de este enfoque produjo resultados claros y cuantificables.

En primer lugar, identificamos los IPJ que realmente cumplían los requisitos para ser retirados, basándonos en la inactividad legal verificada y no sólo en el comportamiento de renovación.

En segundo lugar, descubrimos un número considerable de problemas de calidad de los datos no relacionados con la baja, en particular con la exactitud de los identificadores. La resolución de estas discrepancias mejoró la alineación general entre las bases de datos nacionales de referencia y los registros de la GLEIF.

En tercer lugar, nuestro análisis longitudinal del estado de inscripción de los IPJ demostró que el aumento de los IPJ caducados y retirados reflejaba en gran medida la auténtica dinámica del ciclo de vida de la entidad y no la degradación sistémica de los datos. La incorporación de esta dimensión temporal resultó esencial para interpretar correctamente los datos.

Por último, pasamos de investigaciones manuales ad hoc a flujos de trabajo repetibles y auditables respaldados por criterios claros y resultados documentados, reforzando tanto la coherencia como la gobernanza.

Mejora de la Calidad de datos en todo el Sistema Global del IPJ

Más allá de los importantes beneficios operativos obtenidos, este enfoque representa nuestro firme compromiso con el Sistema Global del IPJ. Al compartir información de manera oportuna y actualizar los datos de referencia del IPJ fuera del ciclo de renovación estándar, estamos ayudando activamente a mantener los más altos estándares de calidad de los datos y a garantizar que los datos de referencia del IPJ sigan siendo precisos y estén actualizados. Esto desempeña un papel crucial en la promoción de la confianza y la transparencia en toda la economía portuguesa y fuera de ella.

Agradecimientos

Este trabajo es el resultado de la colaboración en equipo, que combina los conocimientos, la experiencia y las perspectivas de varios colaboradores cuyos esfuerzos conjuntos han hecho posible este resultado. Me gustaría expresar mi más sincero agradecimiento a todos los que han participado en el proceso, cuyos debates, comentarios y dedicación han sido fundamentales para el desarrollo de este trabajo, con una mención especial a Maria do Carmo Moreno y Bruno Gonçalo Tenório. Las opiniones expresadas en este trabajo no representan necesariamente las de las instituciones y deben entenderse únicamente como la interpretación y el análisis de los autores sobre el tema tratado.

Si quiere hacer comentarios sobre algún artículo del blog, identifíquese con su nombre y sus apellidos. Su nombre aparecerá junto a su comentario. No se publicarán las direcciones de correo electrónico. Tenga en cuenta que, mediante su acceso al foro de debate o su contribución en él, acuerda cumplir los términos de las Directrices sobre los blogs de la GLEIF, por lo que le pedimos que los lea detenidamente.



Lea todas las publicaciones del blog de la GLEIF >
Sobre el autor:

Ana Sofia Afonso es Data Scientist en la División de Gestión de datos del Banco de Portugal. Tiene un Máster en Finanzas. Ana Sofia está especializada en convertir datos complejos y fragmentados en información fiable para la producción estadística y la estrategia. Su trabajo abarca Python y SQL, canalizaciones de datos, análisis y visualización, y estadísticas cada vez más avanzadas, aprendizaje automático, ingeniería de características y prácticas modernas de ingeniería de datos para mejorar la calidad de los modelos, la eficiencia del flujo de trabajo y la fiabilidad de los datos.


Etiquetas para este artículo:
Gestión de Datos, Calidad de los Datos, Datos Abiertos, Índice de IPJ Global, Identificador de Personas Jurídicas (IPJ), Global Legal Entity Identifier Foundation (GLEIF)