新闻与媒体 GLEIF 博客
本网站上除英语以外的翻译由人工智能提供支持。我们不保证准确性,也不对使用翻译内容造成的任何错误或损害承担责任。如有任何不一致或歧义, 英文版 将作为准。

将数据转化为机遇:本月指标--数据质量规则设定

高质量数据不仅仅是一个基准,它还是全球信任、合规和互操作性的战略必需品。在这篇博客中,GLEIF 数据质量管理和数据科学主管 Zornitsa Manolova 重点介绍了结构化、基于规则的数据质量检查方法如何帮助确保全球 LEI 系统中 LEI 参考数据的完整性。


作者: Zornitsa Manolova

  • 日期: 2025-08-07
  • 浏览数:

在相互联系日益紧密的全球经济中,组织信任和有效使用数据的能力是创新、增长和竞争力的基础。

高质量的数据生态系统是变革和创新的驱动力,使组织能够发现并抓住新机遇。与此同时,低数据质量会导致效率低下,并面临监管和声誉风险。

GLEIF 致力于优化 LEI 数据的质量、可靠性和可用性。自 2017 年以来,它发布了专门的月度报告,以透明的方式展示全球 LEI 系统达到的整体数据质量水平。

为了帮助业界更广泛地了解和认识 GLEIF 的数据质量举措,这一新的系列博客探讨了报告中包含的关键指标。

本期博客将继续探讨数据质量规则的制定。

在当今相互关联的金融生态系统中,法定实体参考数据的可靠性至关重要。认识到这一点,全球法人识别编码基金会(GLEIF)与监管委员会(ROC)和 LEI 发行机构密切合作,率先努力提高全球 LEI 体系的数据质量标准。

为支持其维护卓越数据标准的使命,GLEIF 引入了结构化数据质量管理框架,该框架定义了一套透明、可衡量的数据质量标准。这些标准界定了何为高质量数据,是评估 LEI 参考数据完整性的客观基准。

GLEIF 的数据质量检查经过精心设计,以确保 LEI 参考数据符合最新的《状态转换和验证规则》(State Transition and Validation Rules),该规则描述了通用数据文件格式(CDF)下发行、更新、管理和发布的业务规则及其技术实施。

本博客将探讨如何通过数据质量规则设置来定义数据质量检查,以及这如何有助于提高全球金融基础设施的可信度和效率。

什么是数据质量规则设置?

数据质量规则设置是一种结构化和系统化的方法,用于管理如何在全球 LEI 系统中定义、解释和应用每个数据质量检查。该机制确保每个数据质量检查都有特定的结构,包含四个关键部分:

  • 成熟度- 界定与所测量内容相关的流程改进的演变。
  • 质量标准- 数据符合既定质量原则(如准确性、有效性)的程度。
  • 检查意图- 界定规则背后的目标或原理。
  • 形式化逻辑- 表示为前提条件和条件的组合。

检查遵循 "如果-那么 "的逻辑格式:如果满足了某个前提条件 (X),那么还必须满足某个特定条件 (Y)。

例如,如果某个法定实体被标记为 "已退休"(前提条件),那么记录中就必须存在相应的法定实体事件(条件)。如果记录不符合先决条件,则检查视为不适用。如果记录满足前提条件但不满足条件,则检查结果为失败。如果两个条件都满足,则结果为通过。

通过精确定义每个数据质量检查的逻辑,规则设置可确保可重复性,即在全球 LEI 系统中,每次都以相同的方式计算每个数据点。这样就能对数以百万计的 LEI 记录进行透明、一致和可扩展的数据质量评估,促进持续改进并与全球标准保持一致。

为了支持更高的透明度和操作灵活性,每个数据质量检查还分配了标签,以反映其在实施生命周期中的状态。这些标签有助于对检查进行分类,并简化其监控、咨询和报告工作。它们包括

  • 预览- GLEIF 已全面开发、测试和发布该检查。LEI 发布机构可以看到结果,但尚未用于任何公开报告。此阶段提供早期访问,并支持正式咨询前的准备工作。
  • 咨询--检查正在与 LEI 发行机构进行积极咨询。在此阶段,将收集反馈意见,以便对检查逻辑、影响和适用性进行微调。
  • 报告- 检查已通过咨询并正式采用。其结果现在有助于面向公众的产出,如《全球 LEI 数据质量报告》和《LEI 发行机构特定数据质量报告》。

2025 年年度规则制定咨询

归根结底,从数据质量总分 (TDQS) 到成熟度等级和单个质量标准结果,规则制定是本月度量指标系列中的关键绩效指标 (KPI) 的基础。这意味着,与生态系统参与者合作进行持续改进,对于提高信任度和透明度至关重要。

2025 年 7 月 3 日,GLEIF 和 LEI 发行机构开启了 2025 年规则制定的咨询期。在接下来的六周内,利益相关方将在 2025 年晚些时候投入生产实施之前,对 22 项新增和 24 项更新检查进行审查,为 LEI 发行机构准备系统和流程提供明确的跑道。预计这些新增和更新将共同提升整个全球 LEI 系统的标准化和可靠性。

重点包括

  1. 人工智能驱动的 LENU 检查-LENU(法定实体名称理解)是由 GLEIF 和 Sociovestix Labs 共同开发的开源机器学习模型,现在可提出22 个司法管辖区的实体法定形式 (ELF) 代码,从而减少人工映射工作并提高全球一致性。
  2. 更丰富的模式验证--增强的 regex 规则提高了邮政编码和本地标识符的标准,捕捉到更多边缘情况并减少误报。
  3. 五个新代码列表--这些经过精心策划的列表提供了额外的结构,涵盖以下情况
    • 不能有父母或子女的实体
    • 特定 ELF 代码的预期注册机构
    • 政府机构的适当法律形式
    • 不发放识别码的机构

咨询结束后,相关检查会被归类到 "报告 "标签下,使其在报告部分和仪表板上都能看到。在 "数据质量报告 "中,这些检查在 "5 大不合格检查 "下展示,提供了需要关注的关键领域的高级快照。

七月焦点:检查 C000438

数据质量报告中的每个条目都概述了受未通过检查影响的 LEI 发行机构的数量,并确定了未通过率最高的机构。7 月份,C000438 检查是失败率最高的检查。该检查可确保 LEI 发行机构报告的每个直接母公司关系与披露的最终母公司保持一致。它通知 LEI 发行机构,直接母公司链之后的关系结构与公司结构的最终母公司之间的任何差异。7 月份共记录到 22 次平均失误,与 6 月份的 64 次平均失误相比有所下降。这为了解发行人数据质量如何随时间演变提供了宝贵的见解。

将数据转化为机遇

GLEIF 和 ROC 正在指导几个专门的工作组,包括数据质量工作组。这些小组预测新出现的需求,并将其转化为实际改进,从新的数据质量检查到更新的技术标准。这种跨学科的合作方式使 LEI 生态系统在日益数字化和互联化的经济环境中始终保持适用性。

通过整合严格的标准、透明度和社区反馈,GLEIF 不断将高质量数据转化为战略优势,为全球市场参与者提高效率、降低风险并打开创新之门。

如果您希望对博文进行评论,请使用您的姓名来识别自己。您的姓名将显示在您的评论旁。不会公布电子邮件地址。请注意,访问讨论区或在其中发帖即表示您同意遵守GLEIF 博客政策条款,因此请仔细阅读该条款。



阅读先前全部 GLEIF 博文 >
关于作者:

Zornitsa Manolova 是 Global Legal Entity Identifier Foundation (GLEIF) 数据质量管理和数据科学团队的领导者。自 2018 年 4 月起,她负责通过引入创新的数据分析方法来加强和改进既定的数据质量和数据治理框架。在此之前,Zornitsa 曾在普华永道法证部门负责管理国际金融调查的法证数据分析项目。她拥有德国马尔堡菲利普大学的计算机科学专业学位,主修机器学习。


此文章的标签:
数据管理, 数据质量, 开放数据, 全球 LEI 索引, Global Legal Entity Identifier Foundation (GLEIF), 法人机构识别编码 (LEI)