LEI 数据 GLEIF 数据质量管理

数据质量要求采取主动行动

主动管理为了支持 LEI 发放组织,GLEIF 提供恰当的和强制性的流程以及技术接口,使 LEI 发放机构能够对 LEI 和相关参考数据的数据质量展开主动评估。这包括对重复条目进行专项检查。将使用自动网络服务 API 对 LEI 记录逐一进行检查:数据治理预检重复性检查


数据治理预检

LEI 发放机构有义务在将所有新发放和更新的 LEI 记录上传到全球存储库之前,将这些记录发送到 GLEIF 的预检工具中。预检工具采用了与已经公布的 LEI 记录每天进行的相同的数据质量检查。LEI 发放机构可根据预检结果,在这些不一致的数据进入公共数据池之前,对潜在的数据质量问题进行补救。除了检查结果之外,申请人还会收到解释,这有助于对所报告的问题进行有重点、快速的补救。

LEI 发放组织对该工具的强制使用为持续改进流程提供了支持,提高了质量标准,并增加了全球 LEI 体系中数据的成熟度。


重复性检查

为了防止出现重复的数据记录,新申请的 LEI 代码和相应的参考数据将与全球 LEI 存储库中的所有其他记录,以及其他 LEI 发放机构已经提交给重复性检查工具,但尚未发放的 LEI 记录进行比较。因此,即使同一个法人机构与两个不同的 LEI 发放机构进行接洽,LEI 发放机构也会识别潜在的重复内容,并能够与其客户和相互之间进行协调。这个程序最终可以防止在系统中引入重复的内容。

识别重复内容的流程考虑了 LEI 记录的多个数据元素,可分为预处理、核心算法和后处理。

在预处理过程中,数据为接下来的步骤做好准备,例如,所谓的弱标记被识别,并得到处理。弱标记的一个典型例子是法人机构的法律形式,它可以是法人机构名称的一部分。然后,可予以规范和协调法律形式,以确保在下列流程阶段取得最佳的可能结果。

重复性检查工具的核心引擎由唯一性和排他性检查组成,结合了最先进的模糊字符串匹配算法(例如,编辑距离、余弦相似度、Monge-Elkan 距离)。

在后处理步骤中,重复性检查工具基于附加检查和对二级数据元素(例如,司法管辖权、机构类别)的特殊处理,减少了误报的数量。

可供下载的相关文件

下载 PDF 文件:重复性检查大辞典 1.2 版本 (Check for Duplicates Dictionary v1.2)