As traduções deste site em idiomas diferentes do inglês são geradas por IA. Não garantimos a precisão e não nos responsabilizamos por quaisquer erros ou danos resultantes do uso do conteúdo traduzido. Em caso de inconsistências ou ambiguidades, versão em inglês prevalecerá.
Sala de Imprensa e Mídia
Blog da GLEIF
As traduções deste site em idiomas diferentes do inglês são geradas por IA. Não garantimos a precisão e não nos responsabilizamos por quaisquer erros ou danos resultantes do uso do conteúdo traduzido. Em caso de inconsistências ou ambiguidades, versão em inglês prevalecerá.
Como o Banco de Portugal reforça a Qualidade de Dados de LEI à escala
Ana Sofia Afonso, Cientista de Dados na Divisão de Gestão de Dados do Banco de Portugal, partilha uma abordagem prática para manter os mais elevados padrões de qualidade de dados à escala - combinando a verificação cruzada com base em IA em relação a fontes nacionais autorizadas com a facilidade de contestação em massa com base em API da GLEIF.
Autor: Ana Sofia Afonso, Cientista de Dados na Direção de Gestão de Dados do Banco de Portugal
Data: 2026-03-31
Visualizações:
Os dados de alta qualidade do Identificador de Entidade Jurídica (LEI) são fundamentais para garantir que as organizações globais possam confiar e ser confiáveis. No entanto, essa qualidade não pode ser obtida por meio de "limpezas" manuais ad hoc e pontuais que são inconsistentes, lentas e caras. Em vez disso, exige cada vez mais fluxos de trabalho auditáveis e repetíveis, concebidos para melhorar a qualidade à escala e reduzir os processos manuais.
Veja o Desafio de saber quando um LEIs vencidos - que indica que a renovação não ocorreu a tempo - deve ser "retirado" para confirmar que a entidade jurídica cessou as operações. Como isso pode ser alcançado em escala? E, crucialmente, como as decisões podem ser apoiadas com evidências claras, consistentes e verificáveis?
Neste post do blogue, Ana Sofia Afonso, cientista de dados na Divisão de Gestão de Dados do Banco de Portugal, explica como este Desafio foi abordado. Ao combinar a aprendizagem automática (ML) e algoritmos baseados em IA com controlos de qualidade rigorosos e validação especializada para identificar LEIs elegíveis para reforma, reforçou a consistência e a governança dos dados nos sistemas de referência nacionais e internacionais. Isso oferece um modelo que descreve como todos os usuários de dados de LEIs podem ajudar a aumentar a pontualidade, precisão e confiabilidade em todo o Global LEI System.
Entendendo os LEIs em um Ambiente de Dados de Referência Nacional
Em Portugal, todas as entidades jurídicas residentes devem possuir um identificador nacional para fins legais e fiscais. No entanto, os LEIs só são obrigatórios em contextos regulamentares específicos. Como resultado, a cobertura global do LEI permanece mais limitada. Além disso, os eventos do ciclo de vida do LEI são frequentemente acionados por obrigações de reporte externo e não por alterações reais no estatuto jurídico de uma entidade.
Isto cria um Desafio estrutural. À medida que os registos nacionais de empresas evoluem, os dados do LEI - particularmente para as entidades que deixam de renovar os seus dados de referência - podem ficar dessincronizados. Ao longo do tempo, observamos que isso apresenta vários problemas recorrentes:
LEIs vencidos após as entidades correspondentes terem ficado inactivas no registo comercial nacional;
Inconsistências entre os identificadores nacionais registados na GLEIF e os detidos pelas autoridades nacionais (os dados de origem para os sistemas de dados de referência do Banco de Portugal);
A necessidade de investigações manuais que eram demoradas, difíceis de priorizar e impossíveis de escalar de forma eficaz.
Por que os LEIs vencidos exigem uma interpretação cuidadosa
Em resposta a esses desafios, decidimos explorar uma abordagem para melhorar de forma eficiente e eficaz a qualidade dos dados em todo o ciclo de vida do LEI e reforçar a confiança nos dados de referência globais.
Uma perceção importante da nossa análise inicial foi que um LEIs vencido não significa que a entidade jurídica associada está inativa. A não renovação pode simplesmente refletir uma mudança nas obrigações de reporte em vez do encerramento de uma entidade jurídica. Por outro lado, uma entidade pode já estar legalmente inativa enquanto o seu LEIs vencidos ou ainda emitidos.
Mais importante ainda, reconhecemos uma consideração crítica: a retirada incorrecta de um LEI é pior do que a sua não retirada, uma vez que isso representaria erroneamente que uma entidade jurídica cessou as operações. Como consequência, a entidade pode ser prejudicada em sua capacidade de negociar ou realizar suas operações de forma mais geral. Isto significa que confiar no estatuto de "caducado" como um gatilho automático para a retirada introduziria um risco significativo de Governança, e que qualquer solução, portanto, precisava de ser conservadora, baseada em provas e totalmente auditável.
Como resultado, o verdadeiro Desafio era distinguir entre:
a) LEIs que não foram renovados, mas que ainda correspondem a entidades activas, e
b) LEIs associados a entidades que estão legalmente inactivas em Portugal.
A nossa abordagem: IA na verificação cruzada com dados nacionais oficiais
Conseguir esta distinção de forma fiável exigiu a integração de várias fontes de dados e a aplicação de controlos de qualidade consistentes e baseados em provas. Nossa abordagem foi construída em torno de um princípio simples: As decisões do ciclo de vida do LEI devem basear-se em informações nacionais autorizadas e ser executadas de forma controlada e escalável.
Para tal, os dados da GLEIF, fontes externas e o registo comercial nacional são continuamente integrados no nosso ambiente de dados de referência, fornecendo uma visão consolidada da identidade da entidade, estatuto jurídico e estado de registo do LEI. Algoritmos baseados em ML e IA são então aplicados para padronizar nomes e identificadores de entidades e para calcular pontuações de similaridade entre conjuntos de dados, permitindo a verificação cruzada em larga escala de registos de LEI em relação a fontes nacionais autorizadas para identificar quando são necessárias atualizações.
Uma vez validadas, as actualizações são então operacionalizadas através da instalação de contestação em massa activada por API da GLEIF, o que reduz significativamente o esforço manual e simplifica os nossos processos internos. Ao mesmo tempo, o recurso adiciona uma camada extra de garantia ao permitir a validação independente de informações por terceiros. Isso garante que as retiradas de LEI verificáveis sejam processadas de forma consistente, eficiente e com total rastreabilidade, evitando intervenções ad hoc ou manuais desnecessárias.
Também é importante observar que, ao longo do fluxo de trabalho, a supervisão humana permanece essencial. Casos complexos ou ambíguos são escalados para revisão especializada, garantindo que a automação reforce a Governança em vez de substituí-la.
Os resultados: De investigações reactivas a processos controlados
A aplicação desta abordagem apresentou resultados claros e mensuráveis.
Primeiro, identificamos LEIs que eram genuinamente elegíveis para aposentadoria, com base na inatividade legal verificada em vez de apenas no comportamento de renovação.
Segundo, descobrimos um número substancial de problemas de qualidade de dados não relacionados à aposentadoria, particularmente envolvendo a precisão do identificador. A resolução destas discrepâncias melhorou o alinhamento geral entre as bases de dados nacionais de referência e os registos da GLEIF.
Terceiro, nossa análise longitudinal do status de registro do LEI mostrou que os aumentos nos LEIs vencidos e aposentados refletiam amplamente a dinâmica do ciclo de vida da entidade autêntica em vez da degradação sistêmica dos dados. A incorporação desta dimensão temporal provou ser essencial para interpretar os dados corretamente.
Finalmente, fizemos a transição de investigações ad-hoc e manuais para fluxos de trabalho repetíveis e auditáveis apoiados por critérios claros e resultados documentados, fortalecendo a consistência e a Governança.
Melhoria da Qualidade de Dados em todo o Global LEI System
Além dos benefícios operacionais significativos obtidos, essa abordagem representa nosso forte compromisso com o Global LEI System. Ao compartilhar informações em tempo hábil e atualizar os dados de referência do LEI fora do ciclo de renovação padrão, estamos ajudando ativamente a manter as mais altas Normas de Qualidade de Dados e garantindo que os dados de referência do LEI permaneçam precisos e atualizados. Isto desempenha um papel crucial na promoção da confiança e transparência na economia portuguesa e não só.
Agradecimentos
Este trabalho é o resultado de um trabalho de equipa colaborativo, combinando o conhecimento, a experiência e as perspectivas de vários colaboradores cujos esforços conjuntos tornaram este resultado possível. Gostaria de expressar a minha sincera gratidão a todos os envolvidos no processo, cujas discussões, feedback e dedicação foram fundamentais para o desenvolvimento deste trabalho, com uma menção especial a Maria do Carmo Moreno e Bruno Gonçalo Tenório. As opiniões expressas neste trabalho não representam necessariamente as das instituições e devem ser entendidas apenas como a interpretação e análise dos autores sobre o assunto.
Caso queira comentar uma postagem no blog, identifique-se usando seu nome e sobrenome. Seu nome aparecerá ao lado de seu comentário. Endereços de e-mail não serão publicados. Note que ao acessar ou contribuir com o fórum de discussão, você concorda com os termos da Política de Uso do Blog da GLEIF, portanto, leia-a com atenção.
Ana Sofia Afonso é Cientista de Dados na Direção de Gestão de Dados do Banco de Portugal. Tem um Mestrado em Finanças. A Ana Sofia é especialista na conversão de dados complexos e fragmentados em conhecimentos fiáveis para a produção estatística e a estratégia. O seu trabalho abrange Python e SQL, pipelines de dados, análise e visualização, e estatísticas cada vez mais avançadas, aprendizagem automática, engenharia de caraterísticas e práticas modernas de engenharia de dados para melhorar a qualidade do modelo, a eficiência do fluxo de trabalho e a fiabilidade dos dados.