Dane LEI Zarządzanie jakością danych GLEIF

Pytania i odpowiedzi



Pytania i odpowiedzi przedstawione poniżej zawierają szczegółowe informacje na temat zasad stosowanych do monitorowania, oceny i ciągłego doskonalenia poziomu jakości danych w Globalnym Systemie Identyfikatorów Podmiotów Prawnych (LEI). Jakość danych mierzy się na podstawie wyraźnie zdefiniowanych kryteriów jakości opracowanych przez Global Legal Entity Identifier Foundation (GLEIF) w ścisłym porozumieniu z Komitetem Nadzoru Regulacyjnego ds. LEIorganizacjami nadającymi LEI.

W jaki sposób obliczana jest Ogólna punktacja jakości danych LEI?

Ogólna punktacja jakości danych stanowi średnią poszczególnych wyników oceny jakości na podstawie kryteriów jakości danych. Średnia nie jest ważona pod względem kryteriów jakości danych, co znaczy, że każde kryterium jest wliczane w równym stopniu do kalkulacji ogólnej punktacji jakości danych. Ogólna punktacja jakości danych LEI (\(TQ_s\)) obliczana jest wzorem:

$$TQ_s=\frac{\sum_{s=1}^{N}Q_s}{N}$$

Gdzie:

  • \(TQ_s\) to ogólna punktacja jakości danych.
  • \(s\) w sumie jest wskaźnikiem reprezentującym poszczególne kryteria jakości.
  • \(Q_s\) jest punktacją jakości dla danego kryterium jakości.
  • \(N\) to liczba kontrolowanych kryteriów jakości.

Informacje dodatkowe znajdują się w rozdziale 2 Słownika do globalnych raportów dot. jakości danych LEI.

Jaka jest definicja każdego z kryteriów jakości danych stosowanych do pomiaru poziomu jakości danych w Globalnym Systemie Identyfikatorów Podmiotów Prawnych?
Dostępność Dane, które łatwo uzyskać, a dostęp do nich jest zgodny z prawem, przy czym silne zabezpieczenia i mechanizmy kontrolne są wbudowane w proces.
Dokładność Zakres, w jakim dane są pozbawione możliwych do zidentyfikowania błędów; stopień zgodności elementu danych lub zbioru danych z wiarygodnym źródłem uznawanym za prawdziwe oraz stopień, w jakim dane prawidłowo odzwierciedlają rzeczywistość.
Kompletność Stopień, w jakim wszystkie wymagane dane są uzupełniane.
Wszechstronność Wszystkie wymagane pozycje danych powinny zostać włączone – zapewnienie gromadzenia pełnego zakresu danych z potwierdzeniem celowych ograniczeń.
Spójność Stopień, w jakim niepowtarzalna dana ma tę samą wartość w wielu zbiorach danych.
Aktualność Zakres, w jakim dane są aktualne; wartość danych jest aktualna, jeśli jest aktualna w danym momencie, a jest nieaktualna, jeśli była aktualna wcześniej, ale w późniejszym czasie jest nieprawidłowa.
Zgodność Stopień zgodności ze zdefiniowanymi zasadami relacji (np. zgodność powiązań klucza głównego/obcego).
Pochodzenie Historia lub rodowód wartości mienia.
Przedstawienie Cecha jakości danych powiązana z formatem danych, wzorem, czytelnością i przydatnością danych do użycia zgodnie z przeznaczeniem.
Niepowtarzalność Stopień, w jakim wszystkie oddzielne wartości elementu danych występują tylko raz.
Ważność Pomiar zgodności wartości danych ze zbiorem wartości domeny (tzn. zbiór wartości dozwolonych lub zakres wartości).
W jaki sposób wybieranych jest pięć najpoważniejszych przypadków kontroli zakończonych wynikiem negatywnym?

Pięć najpoważniejszych przypadków kontroli zakończonych wynikiem negatywnym to te kontrole jakości danych w miesiącu sprawozdawczym, które wykazały największe niezgodności. Jeśli nie było żadnych kontroli zakończonych wynikiem negatywnym, tabela ta pozostanie pusta. Jeżeli wynikiem negatywnym zakończyło się mniej niż pięć kontroli, wymienione zostaną tylko te, które zakończyły się wynikiem negatywnym.

W jaki sposób opracowuje się mapę termiczną państwa, która przedstawiana jest w globalnych raportach dot. jakości danych?

Wyniki dotyczące jakości w podziale na poszczególne państwa oblicza się na podstawie pola „Entity.LegalAddress.Country” („Podmiot.AdresPrawny.Kraj”) poszczególnych rekordów LEI w każdym kraju (zgodnie z normą ISO-3166).

Kolory przedstawione na mapie termicznej pokazują ogólny wynik jakości danych uzyskany przez wszystkie organizacje nadające LEI w danym państwie:

Kolor czerwony (wynik równy lub mniejszy od 90%), kolor pomarańczowy (wynik powyżej 90% bądź równy lub mniejszy od 95%), kolor żółty (wynik powyżej 95% bądź równy lub mniejszy od 98%), kolor zielony (wynik powyżej 98% bądź równy lub mniejszy od 100%).

Wzór do obliczania wyników jakości dla poszczególnych państw jest podobny do wzoru wykorzystywanego do obliczania ogólnych wyników jakości danych. Oznacza to, że uwzględnia on średnią kryteriów jakości:

$$TQ country=\frac{\sum_{i=1}^{N country}q_i,country}{N country}$$

Gdzie:

  • \(TQ country\) to ogólny wynik dot. jakości danych danego państwa.
  • \(q_i,country\) to wynik kontroli dla danego państwa:

    \(q_i,country\) { (1, jeżeli kontrola zakończyła się „wynikiem pozytywnym” lub „nie dotyczy” – 0, jeżeli kontrola zakończyła się „wynikiem negatywnym”)

  • \(N country\) to liczba kontroli przeprowadzonych w odniesieniu do danego państwa.
Co wyrażają poziomy dojrzałości jakości?

Poziomy dojrzałości określają ewolucję doskonalenia procesów powiązanych z przedmiotem pomiaru. Z tego względu ogólny wynik poziomu dojrzałości jest obliczany w sposób zbiorczy w odróżnieniu od ogólnej punktacji jakości danych: reguły punktacji poszczególnych poziomów dojrzałości mają zastosowanie w taki sam sposób, lecz wyniki wyższych poziomów dojrzałości są wliczane do ogólnej punktacji wyłącznie wtedy, gdy wcześniejszy poziom dojrzałości został w pełni osiągnięty (tzn. punktacja 100%).

Stosowane są następujące poziomy dojrzałości:
Poziom 1 – „Wymagana jakość” (musi wynosić 100% dla wszystkich rekordów danych).
Poziom 2 – „Oczekiwana jakość” (musi wynosić 100%).
Poziom 3 – „Doskonała jakość” (im wyższy, tym lepszy).

Czy GLEIF udostępnia dokumentację określającą zasady regulujące program zarządzania jakością danych?

Tak. Dokumentacja techniczna określająca stosowane kryteria jakości, metody kontroli oraz modele obliczeń dostępna jest tutaj.