Pre zber, spracovanie a interpretáciu dát je nevyhnuté viazať informácie na dohodnuté slovníky, registre, autority, thesaury (a iné zvery). Toto je u nás problém, lebo neexistuje niečo ako súbor autorít - každú autoritu spravuje niekto iný (čo je OK), každá autorita ale má inú (a vačšinou jedinú) formu, každá ma inú kavlitu (služieb, QoS = dostupnosť, garanciu, ...).

Toto vedie tvorcov IS k tomu, že s týmito slovníkmi pracuju nesprávne (a strieľajú si tým do nohy), napr. integrujú sa jednorázovo (stiahnu si slovník), v lepšom prípade dávkovo (stiahnu si ho vždy keď im niečo prestane sedieť), alebo vymýšľajú koleso.

Z týchto dôvodov sa zdá, že jedným z prvých počinov iniciatívy OpenData by mala - mohla - byť konsolidácia v tejto oblasti.

Ako príklad zoberme Register priestorových jednotiek (REGPJ), ktorý spravuje (podobne ako mnohé iné) Štatistický úrad SR: Neposkytuje žiadne integračné rozhrania, notifikácie, služby, štandardné formáty (SKOS, RDF, JSON, ...).

Výstupom by bola "služba", ktorá by na základe (pravidelne aktualizovaného / harvestovaného) REGPJ poskytovala:

  • fulltext vyhľadávanie, rozpoznanie obce (okresu, sídla, ...) na základe záhlavia (textu) alebo identifikátora
  • prevody z GPS do REGPJ (a naspäť) - pre obce aj ostatné jednotky (rieši aj query typu "v ktorom katastri, obci, okrese sa náchádza bod s týmito súradnicami?)
  • online integrácia cez SKOS / WebServices / REST / JSON atď
  • export výsledkov do RDF, JSON, atd
  • podpora pre viacjazycnost
  • prepojenie na relevantné registre - ORSR (kde je zaregistrovana firma?), ZRSR, katastrálny úrad...