Datos del IPJ Gestión de la Calidad de los Datos de la GLEIF

Preguntas y Respuestas



Las siguientes preguntas y respuestas proporcionan información detallada acerca de los principios aplicados para supervisar, evaluar y mejorar de forma continua el nivel de la calidad de los datos en el marco del Sistema Global del Identificador de Personas Jurídicas (IPJ). La calidad de los datos se mide de acuerdo con criterios de calidad claramente definidos, desarrollados por la Global Legal Entity Identifier Foundation (GLEIF) en estrecho diálogo con el Comité de Supervisión Regulatoria de IPJ y las organizaciones emisoras de IPJ.

¿Cómo se calcula la Calificación de la Calidad de los Datos Total del IPJ?

La calificación de la calidad de los datos total de los criterios de calidad de los datos toma la media de las calificaciones de calidad individuales. La media no se pondera por los criterios de la calidad de los datos, lo que significa que todos los criterios de la calidad de los datos contribuyen igualmente a la calificación de la calidad de los datos total. Por lo tanto, la calificación de la Calidad de los Datos Total del IPJ (\(TQ_s\)) es la siguiente:

$$TQ_s=\frac{\sum_{s=1}^{N}Q_s}{N}$$

En la que:

  • \(TQ_s\) es la calificación de calidad de datos total.
  • \(s\) en el sumatorio, es un índice que representa los criterios de calidad individuales.
  • \(Q_s\) es la calificación de la calidad para cada uno de los criterios de calidad respectivos.
  • \(N\) es la cantidad de criterios de calidad para los que se aplican las comprobaciones.

Para obtener más información, véase el capítulo 2 del Diccionario de informes de la calidad de los datos de IPJ globales.

¿Cuál es la definición de cada uno de los criterios de la calidad de los datos aplicados para medir el nivel de la calidad de los datos en el Sistema Global del IPJ?
Accesibilidad Elementos de datos que pueden obtenerse fácilmente y a los que se puede acceder legalmente con salvaguardas y controles robustos integrados en el proceso.
Precisión La medida en la que los datos están libres de errores identificables; el grado de conformidad de un elemento de datos o un conjunto de datos con respecto a una fuente fidedigna que se considera correcta; y el grado en el que los datos reflejan correctamente la verdad sobre los objetos del mundo real.
Totalidad El grado en el cual se rellenan todas las apariciones de datos necesarias.
Exhaustividad Todos los elementos de datos necesarios están incluidos; garantiza que el alcance completo de los datos se recopila con limitaciones intencionales documentadas.
Coherencia El grado en el que una porción única de datos conserva el mismo valor entre distintos conjuntos de datos.
Actualidad El grado en el que los datos están actualizados; un valor de datos está actualizado si es actual para un momento determinado y no está actualizado si fue actual en un momento anterior, pero es incorrecto en otro posterior.
Integridad El grado de conformidad con reglas de relaciones de datos definidas (p. ej., integridad de claves de referencia primarias/extranjeras).
Procedencia Historial o linaje del valor de una propiedad.
Representación La característica de la calidad de los datos que aborda el formato, el patrón, la legibilidad y la utilidad de los datos para su utilización prevista.
Singularidad La medida en la que todos los valores distintivos de un elemento de datos aparecen únicamente una vez.
Validez La medición de la forma en la que un valor de datos se ajusta a su conjunto de valor de dominio (es decir, un conjunto de valores o rango de valores).
¿Cómo se identifican las cinco comprobaciones más fallidas?

Las cinco comprobaciones más fallidas son aquellas comprobaciones de la calidad de los datos que arrojan mayor número de fallos en el mes analizado. En caso de no haber comprobaciones fallidas, esta tabla permanecerá vacía. Si resultan fallidas menos de cinco comprobaciones distintas, solamente las fallidas se recogerán en la lista.

¿Cómo se calcula el mapa caliente que se identifica en los Informes de la Calidad de los Datos Globales?

Las calificaciones de la calidad por país se basan en el campo «Entidad.DirecciónLegal.País» de los registros de cada IPJ individual para cada país (de acuerdo con la norma ISO-3166).

Los colores mostrados en el mapa caliente muestran la calificación de la calidad general de los datos obtenida por todas las organizaciones emisoras de IPJ que emiten IPJ en el país correspondiente:

Rojo (igual o inferior al 90%); naranja (superior al 90% e igual o inferior al 95%); amarillo (superior al 95% e igual o inferior al 98%); verde (superior al 98% e igual o inferior al 100%).

La fórmula para el cálculo de la calificación de la calidad para cada país es similar a la que ofrece la calificación de la calidad de los datos total. Esto significa que tiene en cuenta el promedio de los criterios de evaluación de la calidad:

$$TQ country=\frac{\sum_{i=1}^{N país}q_i,país}{N país}$$

En la que:

  • \(TQ país\) es la calificación de la calidad de los datos total para un país determinado.

  • \(q_i,país\) es el resultado de la comprobación para un país determinado:

    \(q_i,país\) { (1 si la comprobación es «positiva» o «no aplicable» - 0 si la comprobación es «negativa»)

  • \(N país\) es el número de comprobaciones realizadas para el país correspondiente.

¿Qué expresan los niveles de madurez de la calidad?

Los niveles de madurez definen la evolución de las mejoras en los procesos relativos a lo que se está midiendo. Por lo tanto, la calificación total del nivel de madurez se agrega de forma diferente a la de la calificación total de la calidad de los datos: si bien las normas de calificación para los niveles de madurez individuales se aplican de la misma forma, las calificaciones de los niveles de madurez más altos únicamente contribuirán a la puntuación total si se alcanza completamente el nivel de madurez anterior (es decir, puntuación del 100%).

Se aplicarán los siguientes niveles de madurez:
Nivel 1 - «Madurez Necesaria» (debe ser del 100 por cien en todos los registros de datos).
Nivel 2 - «Calidad Esperada» (debería ser del 100 por cien).
Nivel 3 - «Calidad Excelente» (cuanto más, mejor).

¿La GLEIF facilita documentación específica que detalla los principios que rigen el programa de gestión de la calidad de datos?

Sí. La documentación técnica, que explica los criterios de calidad aplicados y las comprobaciones realizadas, además de los modelos de cálculo, está disponible aquí.