OpenData portál data.gov.sk má ambíciu popri zverejnení zdrojov datasetov (rola dátového katalógu) vystupovať aj v roli arbitra - hodnotiť kvalitu zverejnených datasetov.

Metodika hodnotenia kvality datasetov je odvodené z W3C metodiky 5 Stars (5 hviezdičiek).

Hodnotenie datasetov vychádza z predpokladov ako:

  • strojová spracovateľnosť dátového zroja,
  • poskytovanie štrukturovanej informácie,
  • licenčná otvorenosť a nezávislosť od konkrétnej sw aplikácie,
  • štandardizovaný prostriedok na popis štruktúry dátového zdroja - schéma a prípadne sémantika,
  • prepojiteľnosť obsahu dátového zdroja s inými dátovými zdrojmi.


Dátový zdroj:

-dataset má 0 hviezdičiek v prípade, že je neaktuálny
je dostupný na webe a je aktuálny
★★★ + jeho obsah je štrukturovaný
★★★★★ + otvorený formát nezávislý na konkrétnom proprietárnom programovom vybavení (SW)
★★★★★★★ + URL dátového zdroja je jednoznačné a nemenné
★★★★★★★★★ + dáta sú linkované na iné dátové zdroje

Príklady:

Viac informácií na:

(strikethrough = u zapracovane do Návrh metodiky a štandardu pre sprístupňovanie a prepojiteľnosť strojovo spracovateľných dát)

3 Comments

  1. toto je rozumna metodika, u mna velmi dobre

  2. prizla zaujimava pripomienka, ako obsiahnut v popisovani kvality neaktualne data. navrhujem, dat 0 hviezdiciek v tomto prípade.prípade

    1. Suhlasim. Neaktulane data sa daju oznacit ako horsie nez ziadne data. Nuz a teda dataset bez hodnotenia by mal "svietit" (z coho vyplyva, ze na katalogu otvorenych dat bude treba robit hodnotenia velmi rychlo, idealne rovno so zverejnenim datasetu).