LEI 数据 GLEIF 数据质量管理

问题和答案



以下问题和答案提供了适用于监测、评估和持续改进全球法人机构识别编码 (LEI) 体系内的数据质量水平之原则的详细信息。数据质量的衡量是依据明确定义的质量标准,这些标准是由Global Legal Entity Identifier Foundation (GLEIF)通过与LEI 监督管理委员会、以及LEI 发放机构密切对话所制定的。

LEI 总体数据质量得分如何计算?

数据质量标准总体数据质量得分取各质量得分的平均数。该平均数未采用数据质量标准加权,也就是说,每项数据质量标准在总体数据质量得分中的比重相同。因此,LEI 总体数据质量得分 (\(TQ_s\))为:

$$TQ_s=\frac{\sum_{s=1}^{N}Q_s}{N}$$

其中:

  • \(TQ_s\) 为总体数据质量得分。
  • 求和中的 \(s\) 是代表单项质量标准的指数。
  • \(Q_s\) 是各项质量标准的质量得分。
  • \(N\) 是检查中实施的质量标准的数量。

关于更多细节,请参阅 全球 LEI 数据质量报告词典第 2 章。

全球 LEI 体系中为衡量数据质量水平而采用的每项数据质量标准的定义如何?
可及性 数据项易于获取、可合法访问,在流程中建立强劲的保护和控制机制。
精确度 数据中消除可识别错误的程度;数据元素或数据集与被视为正确来源的权威数据来源之间的符合程度;以及数据正确表示实际对象真实状况的程度。
完成度 所有要求出现的数据的填充程度。
综合度 所有要求的数据项均已包含在内,可确保在所记录的既定限制的完整范围内采集数据。
一致性 一条独特数据在多个数据集中,保有相同数据值的比例。
数据的更新 数据更新的程度;如果数据值在某个时间点是更新的,那么数据值就是已更新的,而如果数据值在之前的时间是更新的,但是在后续时间已经不正确了,那么数据值就是过期的。
完整度 与定义的数据关系规则的符合程度(如基础/外部关键参照完整度)。
来源出处 一个属性值的历史记录或谱系来源。
代表性 可以体现既定用途的数据格式、样式、可识别性和有效性的数据质量特性。
唯一性 某个数据元素所有特有值仅出现一次的程度。
有效性 数据值与其域值集(即一系列允许值或允许值区间的集合)的符合程度的指标。
如何确定五大未通过检查?

五大未通过检查是指报告月份中最严重不合格的数据质量检查。如果没有未通过的检查,该表格将保持空白。如果未通过的检查不到五项,那么只会列出那些未通过的。

在全球数据质量报告中,所确定的国家热图是如何计算的?

各国的质量分数是依据各国的各笔 LEI 记录中的Entity.LegalAddress.Country字段(依据 ISO-3166 标准)。

热图中的代表颜色显示所有在相关国家发放 LEI 的 LEI 发放机构所取得的数据质量总体分数:

红色(等于或小于 90%);橙色(大于 90% 且等于或小于95%);黄色(大于 95%且等于或小于 98%);绿色(大于 98%且等于或小于 100%)。

各国质量分数的计算公式与数据质量总分数相似。这意味着会考量到质量标准的平均数:

$$TQ country=\frac{\sum_{i=1}^{N country}q_i,country}{N country}$$

其中:

  • \(TQ country\) 是给定国家的总体数据质量得分。

  • \(q_i,country\) 是 给定国家的检查结果:

    \(q_i,country\) { (1 如果检查为“成功”或“不适用” - 0 如果检查为“未通过”)

  • \(N country\) 是对相关国家所进行检查的数量。

质量成熟度含义如何?

成熟度可以定义衡量内容相关过程的改进发展过程。因此,总体成熟度得分的累积方法与总体数据质量得分不同:虽然单项成熟度得分规则应用方式相同,但仅当完全达到前一个成熟度后(即 100% 得分),更高成熟度的得分才会累加至总体得分中。

采用的成熟度如下:
1 级 – “要求的质量”(所有数据记录必须达到 100%)。
2 级 – “预期的质量”(应达到 100%)。
3 级 – “最佳的质量”(越高越好)。

GLEIF 是否提供详细说明数据质量管理计划监管原则的特定文件材料?

是的。我们提供可以列明所用质量标准、所执行检查和计算模型的技术文档,按此查询。