Child pages
  • Semantics 2015
Skip to end of metadata
Go to start of metadata

Vďaka projektu COMSODE som sa v dňoch 15. až 17.9.2015 zúčastnil konferencie Semantics 2015 z ktorej som si odniesol aj niekoľko zaujímavých dojmov k téme Open Data.

Open Data všeobecne

Jeanne Holm

V úvodnom príhovore Jeanne Holm trochu odbočila od hlavnej témy konferencia a poukázala na to, že rôzne údajové aktivity nekončia technológiou, algoritmom či nejakým datasetom, ale že je potrebný reálny pozitívny výsledok pre bežných ľudí. A teda že napríklad zverejňovanie otvorených údajov má pomôcť ľudom v Afrike pri hľadaní miesta na vŕtanie studne, alebo obyvateľom USA pri hľadaní konkrétnej trasy úteku pred hurikánom v čase, keď komunikačné siete vypadávajú a podobne.

Jeanne tiež hovorila o tom, že pre poskytovateľov otvorených údajov je prirodzená zvedavosť (niekedy aj potreba dokladovať a obhájiť zdroje vynaložené na publikovanie), že kto a ako využíva zverejnené údaje. Ale ako to robiť slušne, k spokojnosti oboch strán? V USA sa ako najlepšia javí kombinácia hackatonov (každý k nejakej téme či konkrétnym datasetom) a otvorenej komunikácie (komunikácia na sociálnych sieťach, aktívne pýtanie si spätnej väzby a jej následné otvorené a promptné riešenie napr. pomocou tzv. "issues" na GitHub - viď https://github.com/GSA/data.gov/issues, atď.).

(linka na samotnú prezentáciu: http://www.slideshare.net/semwebcompany/jeanne-holm-data-mining-for-good-how-linked-data-is-transforming-cities)

Slow-cooked data

Oscar Corcho prezentoval veľmi zábavným spôsobom niekoľko dobrých odporúčaní ohľadom otvorených údajov na základe paralel s jedlom. Začal pomocou analógií medzi Big Data a Fast Food:

  • zahltenie množstvom údajov,
  • v príliš krátkom čase,
  • atď.

a potom formuloval päť pravidiel pre "pomaly varené údaje":

  1. dobre vyberať, ktoré údaje publikujeme
    1. nápoveda: Zverejňovať treba najmä užitočné údaje, viď napr. http://global.census.okfn.org/place/sk, https://github.com/otvorenavlada/akcnyplan2015/tree/master/uloha-03#vyhodnotenie-dopytu alebo slide č. 22 v prezentácii.
  2. popísať zverejnené údaje a uviesť aj príklady, aby ľudia lepšie a rýchlejšie pochopili čo je vlastne zverejnené
    1. Popis je ale korením, takže netreba preháňať a zverejňovať obsiahle a zložité dokumenty.
  3. zverejňovať údaje vo viacerých formátoch: CSV, JSON, RDF, JSON-LD a pod. ale tak ako v bode dva, netreba preháňať a poskytovať všetky možné formáty
  4. aj deťom treba vedieť vysvetliť prínosy otvorených údajov a tiež napríklad aj spôsoby, akými môžu prispieť k zlepšeniu ich mesta
  5. "eat your own ...", t.j. používať údaje ktoré zverejňujem aj vo svojich vlastných aplikáciách

V závere poukázal aj na svetlú stránku fast food: človek kdekoľvek na svete dostane takmer to isté, bez prekvapení. Pre údaje to znamená dôležitosť štandardizácie: aby ten istý typ údajov bol všade zverejnený v rovnakej štruktúre, vďaka čomu by mohla aplikácia napr. z New Yorku ľahko fungovať aj v Bratislave.

Slidy k prezentácii:

Get Adobe Flash player

(http://www.slideshare.net/ocorcho/slowcooked-data-and-apis-in-the-world-of-big-data-the-view-from-a-city-perspective , ak nefunguje náhľad prezentácie priamo v tejto stránke)

ODINE

Ak plánujete založiť start-up v ktorom má hrať významnú rolu použitie alebo poskytovanie otvorených údajov, projekt Open Data Incubator vám ponúka možnosť equity free fundingu do výšky 100 000 €, pomoc expertov, podporu pri získavaní kontaktov, medializáciu alebo aj predstavenie potencionálnym investorom.

Open Data vs. Linked Data

Zaujímavé uplatnenie (aj) Linked Data technológií pri spracovaní textov ústav rôznych štátov ukazuje projekt Constitute, kde si môžem napríklad nájsť ústavy v ktorých sa spomína "pivo" a vo výsledkoch vidno aj štrukturovaný výpis relevantných častí ústavy:

Pri publikovaní otvorených údajov vo forme Linked Data by nám v budúcnosti mohol pomôcť projekt SimplePARQL poskytnúť ľudskejšie rozhranie na dopytovanie, keďže umožňuje v dopytoch používať obyčajné "key words" namiesto URI.

Linked Data

Princípy a technológie Semantic Web a Linked Data používajú vo svojich službách napr. Yahoo a Google (Knowledge Graph). O niektoré detaily reálneho využitia v Yahoo sa podelil Peter Mika, keď napríklad ukázal niektoré zaujímavé chyby pri sémantickom obohacovaní výsledkov vyhľadávania:

Peter o.i. spomenul, že GitHub je dobrým nástrojom aj pre manažovanie ontológií, ktorý používajú napr. pre schema.org .

Na niektoré ďalšie prínosné aplikácie poukázal aj Sam Rehman vo svojej prednáške o "Internet of Things" (internet vecí), napríklad pri dokumentovaní vzťahov medi jednotlivými "vecami" (dôležité na plné využitie ich peer-to-peer spolupráce) alebo pri zverejňovaní pozorovaní odvodených z tzv. "surových dát" (v prípadoch, keď sa napr. publikujú údaje zo senzorov a z týchto údajov sa odvodzujú pozorovania či dokonca udalosti, je dôležité popísať, čo presne to pozorovanie alebo udalosť znamená, napr. použitím ontológií).

Linked data v SR

Miroslav Liška predstavil návrh ontológií pre slovenské linkované údaje, na ktorom pracuje vrámci činnosti Komisie pre štandardizáciu IS VS pri Ministerstve financií SR. Jedná sa akoby o preklopenie tzv. Katalógu dátových prvkov (viď linku, ktorý je prílohou Výnosu 55/2014, viď ďalšiu linku) z formátu XML aj do formátu OWL s použitím jednotných štandardizovaných URI na báze http://data.gov.sk . Nezabúda sa na prelinkovanie aj na iné štandardné ontológie používané vo svete (FOAF, SKOS, ...).

Iné

Obed na konferencii bol trochu v štýle Starship Enterprise, keďže sa konal vo veľmi zaujímavých priestoroch Vienna University of Economics and Business:

Star Wars referenciu zase zabezpečil Clemens Wass:

"It surrounds us and penetrates us;
it binds the galaxy together."


Mal na mysli zákon.

  • No labels