Zdroje informácií
Východsko
- Metodický pokyn k výnosu Ministerstva financií Slovenskej republiky z 8. septembra 2008 č. MF/013261/2008-132 o štandardoch pre informačné systémy verejnej správy
- VÝNOS Ministerstva financií Slovenskej republiky z 9. júna 2010o štandardoch pre informačné systémy verejnej správy
- Návrh technickej špecifikácie štandardov pre Datasety v SR
- OASIS Metodika OpenData 1.0
Sprístupňované dáta
Dátové katalógy
Centrálny katalóg by mal mať základnú funkcionalitu pre poskytovateľov dát, nevyhnutnú pre pokrytie procesu registrácie nového dátového zdroja, následnú aktualizáciu informácií a prípadné odstránenie informácií o dátovom zdroji.
Centrálny katalóg by mal mať možnosť agregovať informácie z dátových katalógov na nižšej úrovni a poskytovať informácie o svojom obsahu pre ostatné katalógy a systémy.
Problematika katalógov je podrobne rozpracovaná oblasti archívnictva. Odporúčaný štandard pre poskytovanie údajov o katalógu a agregácie údajov z iných katalógov je Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH), prípadne nový štandard Data Catalog Vocabulary (DCAT) z dielne W3C a EU projektu open-data.europa.eu.
Kvalita datasetov
Formáty pre zverejňovanie
Používané formáty
| ||||||
---|---|---|---|---|---|---|
Odporučené formáty pre poskytovanie prepojiteľných strojovo spracovateľných dát
V súčasnej dobe sa začína uplatňovať technológia linkovaných/prepojiteľných dát ( linked data) využívajúca RDF formát.
RDF - Resource Description Framework
Umožňuje zápis grafových (sieťových) dát. Umožňuje zachytiť ľubovolné štrukturované dáta v strojovo spracovateľnej podobe. Ponúka štandardizovaný spôsob zápisu štruktúry a sémantiky dát. Je založený na známych princípoch webu umožňujúcich prepájanie súvisiacich dát z rôznych zdrojov.
RDF rozširuje linkovanie webových objektov definovaných jednoznačnými URI pridaním relácií medzi objektmi. Jednoznačná relácia dvoch objektov (dve jednoznačné URL linky popisujúce objekty) je definovaná treťou jednoznačnou URL linkou popisujúcou samotnú reláciu. Takýto vzťah nazývame "triple". (viac info napr. http://en.wikipedia.org/wiki/Resource_Description_Framework) Pomocou tohto modelu je možné spájať štrukturované a čiastočne štrukturované dáta, definovať medzi nimi vzťahy a zdieľať ich pre rôzne aplikácie.
Ide o základný prvok tzv. Prepojiteľných strojovo spracovateľných dát (Linked Data) štandardizovaný na úrovni W3C.
Aktuálne špecifikácie štandardov W3C.
(strikethrough = u zapracovane do Návrh metodiky a štandardu pre sprístupňovanie a prepojiteľnosť strojovo spracovateľných dát)
Prípustné nie sú
- tabuľky vyjadrené v textovom súbore
- proprietárne formáty tabuľkových súborov - napr. XLS
- súbory obsahujúce aktívne prvky tabuliek (napr. makrá, vzorce)
- iba obalenie nevhodného súboru do XML
(strikethrough = u zapracovane do Návrh metodiky a štandardu pre sprístupňovanie a prepojiteľnosť strojovo spracovateľných dát)
Prepojiteľné dáta - Linked Data
TO DO
Treba prebehnúť a zapracovať návrh z PS1 pre štandardy prepojiteľných dát.
Z dôvodu stále narastajúceho objemu strojovo spracovateľných dát z rôznych zdrojov je nutné hľadať formy vzájomnej prepjiteľnosti dát. Riešením je poskytovanie vzájomne prepojiteľných dát (Linked Data).
Dáta je vhodné publikovať tak, aby prepojiteľnosť umožňovali. Prepojiteľnosť je možné charakterizovať nasledujúcimi technologickými princípmi:
Konkrétne a abstraktné objekty majú priradené jednoznačné URI ako jednoznačné identifikátory.Používajú sa iba HTTP URI tak, aby webové prehliadače a aplikácie mohli k URI pristupovať a získať informácie o príslušnom objekte.Konkrétne HTTP URI daného objektu poskytuje dáta o objekte v strojovo spracovateľnej forme vo formáte RDF - Resource Description Framework.Dáta o objekte obsahujú prepojenie na iné objekty znovu pomocou jednoznačných HTTP URI.
Odporúčané formáty pre prepojiteľné dáta
| ||||||
---|---|---|---|---|---|---|
Prípustné nie sú
- nekonzistentné či neúplné dáta
(strikethrough = u zapracovane do Návrh metodiky a štandardu pre sprístupňovanie a prepojiteľnosť strojovo spracovateľných dát)
API pre strojovo spracovateľné a prepojiteľné dáta
- ide o prístup ku aplikácii spravujúcej bázy údajov o datasete
- minimálne požiadavky:
- odporúčané formáty: ako vyššie (v časti "Formáty pre zverejňovanie") ale navyše aj vo formáte RDF (Turtle, RDF/XML, ...) cez SPARQL endpoint
- odporúčaný formát pre dátové katalógy a archívy OAI-PMH alebo Data Catalog Vocabulary (DCAT)
Formát | Nezávislosť na aplikácii | Zápis v štrukturovanej podobe | Popis štruktúry dát | Popis sémantiky dát | Prepojiteľnosť, linkovanie | Kvalita* |
---|---|---|---|---|---|---|
OData | Áno | Áno | Áno | Čiastočne | Čiastočne | ★★★★ |
RDF/SPARQL endpoint | Áno | Áno | Áno | Áno | Áno | ★★★★★ |
Prípustné nie sú
- nekonzistentné či neúplné dáta
- nekonzistentné či neúplné API (ak napríklad obsahuje funkciu "getItem()" ale neobsahuje "listItems()")
- nekonzistentná či neúplná dokumentácia k API
- nevysvetlené a neohlásené výpadky funkčnosti API
Relevantné časti výnosu
§ 11 Middleware protokoly sieťovej komunikácie
Štandardom pre middleware protokoly sieťovej komunikácie je používanie
a) protokolu Simple Object Access Protocol (SOAP) minimálne vo verzii 1.2 pri komunikácii medzi servermi v rámci jednej správy a komunikácii medzi klientom a serverom,
b) webových služieb na prístup klientskych aplikácií prostredníctvom internetu na serverové aplikácie správy,
c) protokolu Hypertext Transfer Protocol (HTTP) na poskytnutie vrstvy webovej služby pre existujúcu serverovú aplikáciu a komunikáciu na aplikačnej úrovni,
d) jazyka Web Services Description Language (WSDL) na definíciu webovej služby,
e) registra Universal Description, Discovery and Integration (UDDI) minimálne vo verzii 1.0 na komunikáciu medzi klientom a serverom,
f) špecifikácií pre mapové služby pod
1. OpenGIS WebMap Service (WMS),
2. OpenGIS Web Feature Service (WFS),
3. OpenGIS Web Coverage Service (WCS),
4. OpenGIS Web Processing Service (WPS),
5. OpenGIS Catalog Service for Web (CSW).
§ 12 Popisný jazyk pre dátové prvky
Štandardom pre popisný jazyk pre dátové prvky je používanie jazyka Extensible Markup Language (XML) podľa World Wide Web Consortium (W3C) pre dátové prvky pri vstupe na rozhranie informačného systému verejnej správy.
§ 13 Prenos dátových prvkov
Štandardom pre prenos dátových prvkov je používanie
a) jazyka schém XML Schema Definition (XSD) minimálne vo verzii 1.0 na výmenu dátových prvkov medzi všetkými informačnými systémami verejnej správy nezávisle od účelu správy,
b) formátu Extensible Markup Language (.xml) vo verzii 1.0 podľa Word Wide Web (W3C) pri výmene dátových prvkov,
c) špecifikácie znakovej sady Unicode Transformation Format (UTF), a to 8-bitové kódovanie UTF-8 pre integráciu údajov,
d) transformačného jazyka XSL Transformations (XSLT) podľa World Wide Web Consortium (W3C) pri transformácii dátových prvkov,
e) modelovacieho jazyka Geography Markup Language (GML) pri výmene priestorových údajov.