Úrad splnomocnenca vlády SR pre rozvoj občianskej spoločnosti v spolupráci s Národnou agentúrou pre sieťové a elektronické služby sa slovenskej verejnosti pýtajú na prioritné údaje verejnej správy, tie ktoré vôbec dostupné nie sú ale aj tie ktoré dostupné sú ale ich dostupnosť treba zlepšiť. Viď výzvu na adrese http://bit.ly/konzultacia a samotný formulár na adrese http://bit.ly/konzultacia2015 . Verejná konzultácia prebieha do 17.3.2015.

Na OSS víkende dňa 14.3.2015 odznela pripomienka od návštevníka, že on by sa aj rád zapojil ale nevie čo má chcieť.

Zneužijem teda zopár vecí, ktoré mi utkveli v pamäti za ostatné roky participácie v komunite OpenData.sk a dám odporúčanie na to, "čo by sme mali chcieť" tým, že tu uvediem moju odpoveď do verejnej konzultácie.

Na OSS víkende bol spomenutý OKFN index, budem sa teda opierať aj o ten. Viď celý index za rok 2014 na adrese http://index.okfn.org/ a konkrétne údaje za Slovensko na adrese http://index.okfn.org/place/slovakia/ .

Väčšina položiek je v časti "treba zlepšiť ich dostupnosť", keďže dnes už sú dostupné, ale iba ako HTML, cez webové portály. A teda nedajú sa (ľahko) stiahnuť, nie sú strojovo spracovateľné, atď.

Poradie je moje, subjektívne, na základe odhadovaného dopytu a pozitívnych dopadov.

Z odporúčania si teda povyberajte čo sa páči Vám, zmeňte poradie podľa vlastných preferencií, prípadne doplňte a odošlite do Verejnej konzultácie. Prosba: Ak ste niečo pridali, dajte mi prosím vedieť na hanecak(at)opendata.sk . Vopred ďakujem.

Sprístupnenie ktorých (momentálne nedostupných) údajov je pre Vás dôležité?

  1. stavebné konania (jednotlivé miestne aj vyššie stavebné úrady): kde sa kedy a čo mení, kde a kedy bola podaná žiadosť na čo, atď.
  2. evidencia sťažností, podaní, petícií (všetci): anonymizované (alebo aspoň agregované) údaje o tom, kedy a k čomu boli občanmi podané podnety + stav vybavenia
  3. štatistiky kriminality (MV SR, prípadne mestské polície): anonymizované, až na úroveň dní a ulíc
  4. štatistiky dopravných nehôd (MV SR): anonymizované, až na úroveň dní a ulíc
  5. zoznamy či štatistiky počtu a druhov vozidiel v SR (MDVRR SR)
  6. zoznam chránených a inak významných území (SAŽP, možno ďalší): vrátane tzv. "shape"

  7. zoznam sudcov (MS SR)

  8. zoznam športovísk (MŠ SR)
  9. zoznam múzeí, galérií, knižníc, atď. (MK SR)
  10. zoznam výskumných projektov (MŠ SR)
  11. lesné hospodárske plány (???): kde sa má koľko vyťažiť

Pri ktorých údajoch je potrebné zlepšiť ich dostupnosť?

  1. mapové údaje (Geodetický a kartografický ústav Bratislava, zrejme aj iní): pridať ulice, riadne zdokumentovať (čiastočne existujúce) REST API
  2. zoznam PSČ, ulíc, adresných bodov (Slovenská pošta, MV SR): chýbajú v ňom aktuálne ulice v mnohých mestách + GPS koordináty
  3. Obchodný register (MS SR)
  4. celkovo jeden alebo viac registrov, kde by boli všetky organizácie (s.r.o., a.s., živnostníci, neziskové organizácie, nadácie, o.z., verejné inštitúcie, atď.)
  5. Kataster: sprístupnenie pomocou REST API
  6. zmluvy, objednávky a faktúry (ÚV SR):
    1. špecificky CRZ.gov.sk: pridať REST API
    2. všeobecne pre celú štátnu správu a samosprávu: použiť otvorený súborový formát alebo REST API, najlepšie s jednotnou schémou/formátom pre celú SR, ideálne s jednotnou kategorizáciou druhov výdavkov
  7. cestovné poriadky (ŽSR, ale aj iný štátom či samosprávou prevádzkovaní dopravcovia): použiť napr. formát GTFS
  8. plán štátneho rozpočtu (MF SR)
  9. čerpanie štátneho rozpočtu (MF SR): až na úroveň transakcií (jednotlivých platieb)
  10. národné štatistiky (ŠÚ SR) 
  11. obchodný vestník (MS SR) 
  12. súdne rozhodnutia (MS SR)
  13. právne informácie (MS SR) 
  14. informácie o znečistení a emisiách (SHMÚ, možno aj ďalší): voda, vzduch, zem
  15. informácie z rokovaní vlády (ÚV SR): čo a kedy bolo prejednané + linky na materiály + hlasovania
  16. hlasovania poslancov + prepisy ich vystúpení (NR SR)
  17. výsledky volieb (ŠÚ SR)
  18. zoznam rozhodnutí o kontrole (ÚVO): lepšie CSV, t.j. pridať do samotného CSV aj položky "číslo oznámenia", "číslo rozhodnutia", "linka na plné znenie rozhodnutia v PDF", "ako bolo rozhodnuté", prípadne ďalšie metaúdaje ak sú k dispozícii

Vo všetkých prípadoch tiež platí:

  • použiť otvorený, strojovo spracovateľný formát, prípadne REST API
  • uviesť jednoznačnú otvorenú licenciu, ideálne napr. CC-BY
  • ľahko nájditeľné tlačítko "stiahnuť / download" alebo "API" (s linkou na API samotné ale aj dokumentáciu k API)
  • ubezpečiť sa, že je popis údajov a linka na údaje alebo API uvedená na data.gov.sk

Doplnenie

2017: Na základe výsledkov verejnej konzultácie bola sformulovaná úloha č. 3 akčného plánu OGP na rok 2015, viď:

Prieskum bol neskôr zopakovaný aj v roku 2017 (úlohy č. B.8 a B.14 akčného plánu 2017-2019) a výsledky možno nájsť tu:

2020: Prioritizácia datasetov už prebieha aj na úrovni EÚ, viď High value datasets, ako súčasť revízií PSI smernice, ktoré bude SR transponovať do našej legislatívy.

3 Comments

  1. Cyklokoalíciu zaujímajú aj ďalšie datasety:

    1. Turistické a cykloturistické trasy (Klub slovenských turistov*, Slovenský cykloklub*, * = nie sú verejná správa, ale činnosť z veľkej časti je financovaná z grantov alebo iných verejných zdrojov)
    2. Vedenie trás EuroVelo (Príslušný VÚC. EV 13: BSK; EV6 BSK+NR+TT; EV 13: PO,KE)
    3. Cestné a dopravné dáta, najmä sčítania cyklistov (SSC)
    4. Dáta týkajúce sa dochádzky do zamestnania zistené v sčítaní Štatistický úrad: Trojica bydlisko osoby, sídlo zamestnávateľa, čas. Z dôvodov anonymizácie zrejme agregované s vhodnou granularitou (napr. ZSJ alebo napr. štvorec 100x100 m).
    5. Štatistiky dopravných nehôd
    6. Obrazové a textové dáta týkajúce sa pamiatok, pozoruhodností (štát, obce, múzeá, kultúrne inštitúcie)
    7. Demografické dáta (Štatistický úrad): najmä dáta s granularitou ZSJ alebo nižšou (počet obyvateľov, veková štruktúra).
    8. Mapové dáta, najmä dáta vektorového charakteru (Geodetický a kartografický ústav Bratislava)
    9. Popisné dáta budov a ich určenia (SAŽP, dáta zverejnené napr. na http://rzsj.enviroportal.sk/prehliadac/ ): polygón budovy, charakter (bytový, rodinný dom; škola, multifunkčná budova, atď.)

    s tým, že ujasnili aj prípadné spôsoby použitia:

    1. Demografické dáta s dostatočnou granularitou je možné použiť pri Cost-Benefit analýze (odpovede na otázky: Koľko ľudí býva v blízkosti navrhovanej cyklotrasy, zastávky?)
    2. Dáta týkajúce sa dochádzky možno použiť pri navrhovaní trás MHD, plánovaní cyklotrás, dopravných tokov všeobecne.
    3. Popisné dáta budov a ich určenie je možné využiť na ďalšie spresnenie C-B analýzy (z kvantitatívneho charakteru: vzdialenosť zastávky, cyklotrasy od budov, z kvalitatívneho charakteru: obslužnosť)
    4. Dopravné dáta, najmä dáta o sčítaní cyklistov je možné využiť pri navrhovaní cyklotrás. Ďalej, aj IAD dáta je možné využiť pri navrhovaní vhodných trás pre cyklistov (napr. preferencia dopravne upokojených ciest).
    5. Trasovanie turistických a cykloturistických trás: je zabezpečované KST a SCK, je teda problematické "vyžadovať" dáta od združení. Vzhľadom však k tomu, že tieto združenia plnia akúsi centrálnu funkciu, a veľká časť ich činnosti je financovaná z verejných zdrojov, bolo by vhodné ich prizvať a poprosiť ich o spoluprácu.
    6. Trasy Eurovelo: Mimoriadne vhodné zverejniť GPS tracky z pohľadu cykloturizmu. Eurovelo je riešené i v rámci EÚ projektov, je zarážajúce, že presné trasovanie týchto významných spojníc nie je zverejnené. (porov. mapky na http://www.eurovelo.sk/en/6 )
    7. Otvorené zverejnenie katastrálnych dát významne prispeje k lepšej a pohodlnejšej práci pri urbanistických činnostiach.
    8. Zverejnenie štatistiky dopravných nehôd významne prispeje k bezpečnejšiemu návrhu dopravných ťahov, k lepšej práci polície, k lepšej osvete (ktoré priestupky najčastejšie vedú k tragickým nehodám?). Umožní lepšie komunikovať o rizikách a potrebách cyklistov, chodcov.
    9. Obrazové a textové dáta týkajúce sa pamiatok, pozoruhodností zverejnené pod open licenciou by mohli využiť občania - prispievatelia do rôznych portálov napr. Wikitravel. Tak budú propagovať turizmus vo svojom regióne (Wikitravel je medzinárodne najpoužívanejší turistický bedeker), pričom štát (obec) to nestojí absolútne nič, len "vzdanie sa" autorských práv. Pre ilustráciu, http://wikitravel.org/en/Bansk%C3%A1_%C5%A0tiavnica neobsahuje žiadne obrázky o našej UNESCO lokalite.

    A ešte dovetok:

    Cyklokoalícia aktívne mapuje a navrhuje vedenie cyklotrás najmä na území Bratislavy. Navrhované cyklotrasy sme zanášali i do projektu OSM.

    Nami vypracované analýzy (C-B analýzy, mapy a pod.) zverejníme otvorene (t.j. tak otvorene, ako to umožní licencia použitých dát).

  2. Poznámka k 2018/12: Keďže sa vcelku obtiažne dostávame ku "katalógu", z ktorého by sme mohli vyberať (povedzme napr. tzv. "nulté datasety", ktoré by mali byť výsledkom OGP úloh), tak môže pri prípadných tipoch alebo rozhodovaní o dôležitých údajoch pomôcť napr. tento dokument z podskupiny "K9.4 Referenčné údaje":

    Zoznam ref udajov - Datova Integracia

  3. Určitým vodítkom k stanovovaniu dopytu bez "nultých datasetov" môže byť aj popularita rôznych datasetov v zahraničí, viď napr. sumár od Sunlight Foundation:

    https://sunlightfoundation.com/2017/09/11/whos-at-the-popular-table-our-analysis-found-which-open-data-the-public-likes/