Preskoč na obsah

Novinky Novinky

Späť

Open Definition v2.0

Autor/ka: Gabriel Lachmann
Open Knowledge a Open Definition Advisory Council uvoľnili v týchto dňoch Open Definition verzia 2.0.

Ide o skupinu princípov, ktoré definujú otvorenosť vo vzťahoch dát a obsahu a hrajú kľúčovú rolu v podpore rozvoja open data ekosystému.

Anglická verzia:
(Bude preložená do Slovenčiny - Ak sa nájde niekto, kto by vedel rýchlo zabezpečiť preklad ozvite sa prosím na opendata(at)opendata.sk.)

Version 2.0

The Open Definition makes precise the meaning of "open" with respect to knowledge, promoting a robust commons in which anyone may participate, and interoperability is maximized.

Summary: Knowledge is open if anyone is free to access, use, modify, and share it — subject, at most, to measures that preserve provenance and openness.

This essential meaning matches that of "open" with respect to software as in the Open Source Definition and is synonymous with "free" or "libre" as in the Definition of Free Cultural Works. The Open Definition was initially derived from the Open Source Definition, which in turn was derived from the Debian Free Software Guidelines.

The term work will be used to denote the item or piece of knowledge being transferred.

The term license refers to the legal conditions under which the work is made available. Where no license has been offered this should be interpreted as referring to default legal conditions governing use of the work (for example, copyright or public domain).

1. Open Works

An open work must satisfy the following requirements in its distribution:

1.1 Open License

The work must be available under an open license (as defined in Section 2). Any additional terms accompanying the work (such as a terms of use, or patents held by the licensor) must not contradict the terms of the license.

1.2 Access

The work shall be available as a whole and at no more than a reasonable one-time reproduction cost, preferably downloadable via the Internet without charge. Any additional information necessary for license compliance (such as names of contributors required for compliance with attribution requirements) must also accompany the work.

1.3 Open Format

The work must be provided in a convenient and modifiable form such that there are no unnecessary technological obstacles to the performance of the licensed rights. Specifically, data should be machine-readable, available in bulk, and provided in an open format (i.e., a format with a freely available published specification which places no restrictions, monetary or otherwise, upon its use) or, at the very least, can be processed with at least one free/libre/open-source software tool.

2. Open Licenses

A license is open if its terms satisfy the following conditions:

2.1 Required Permissions

The license must irrevocably permit (or allow) the following:

2.1.1 Use

The license must allow free use of the licensed work.

2.1.2 Redistribution

The license must allow redistribution of the licensed work, including sale, whether on its own or as part of a collection made from works from different sources.

2.1.3 Modification

The license must allow the creation of derivatives of the licensed work and allow the distribution of such derivatives under the same terms of the original licensed work.

2.1.4 Separation

The license must allow any part of the work to be freely used, distributed, or modified separately from any other part of the work or from any collection of works in which it was originally distributed. All parties who receive any distribution of any part of a work within the terms of the original license should have the same rights as those that are granted in conjunction with the original work.

2.1.5 Compilation

The license must allow the licensed work to be distributed along with other distinct works without placing restrictions on these other works.

2.1.6 Non-discrimination

The license must not discriminate against any person or group.

2.1.7 Propagation

The rights attached to the work must apply to all to whom it is redistributed without the need to agree to any additional legal terms.

2.1.8 Application to Any Purpose

The license must allow use, redistribution, modification, and compilation for any purpose. The license must not restrict anyone from making use of the work in a specific field of endeavor.

2.1.9 No Charge

The license must not impose any fee arrangement, royalty, or other compensation or monetary remuneration as part of its conditions.

2.2 Acceptable Conditions

The license shall not limit, make uncertain, or otherwise diminish the permissions required in Section 2.1 except by the following allowable conditions:

2.2.1 Attribution

The license may require distributions of the work to include attribution of contributors, rights holders, sponsors and creators as long as any such prescriptions are not onerous.

2.2.2 Integrity

The license may require that modified versions of a licensed work carry a different name or version number from the original work or otherwise indicate what changes have been made.

2.2.3 Share-alike

The license may require copies or derivatives of a licensed work to remain under a license the same as or similar to the original.

2.2.4 Notice

The license may require retention of copyright notices and identification of the license.

2.2.5 Source

The license may require modified works to be made available in a form preferred for further modification.

2.2.6 Technical Restriction Prohibition

The license may prohibit distribution of the work in a manner where technical measures impose restrictions on the exercise of otherwise allowed rights.

2.2.7 Non-aggression

The license may require modifiers to grant the public additional permissions (for example, patent licenses) as required for exercise of the rights allowed by the license. The license may also condition permissions on not aggressing against licensees with respect to exercising any allowed right (again, for example, patent litigation).

Zdroj: OKFN http://blog.okfn.org/2014/10/07/open-definition-v2-0-released-major-update-of-essential-standard-for-open-data-and-open-content/
Priemerne (0 Hlasy)


O projekte O projekte

Projekt OpenData

Autor/ka: wiki

Ciele projektu

Na základe východiskovej situácie stanovujeme nasledovné ciele pre projekt:

  • zadefinovať formáty a opensource technológiu pomocou ktorej by inštitúcie mohli efektívne poskytovať dáta - vytvoriť pilotnú implementáciu Open Data Node,
  • propagácia myšlienky zdieľania verených informácií medzi občanmi a štátnymi inštitúciami a inštitúciami medzi sebou
  • podpora tretieho sektoru v budovaní riešení nad týmto riešením,
  • vytvoriť prototyp súborného katalógu,
  • vytvoriť prototyp dátového skladu (DWH) určeného na zber, spracovanie a ukladanie metadát o dátach poskytovaných inštitúciami,
  • vybudovať reportovaciu vrstvu nad dátami pre komfortné vytváranie reportov a modelovanie dát pomocou webového grafického rozhrania - Open Data Portál,
  • legislatívne dosiahnuť publikovanie dát generovaných verejným sektorom pod licenciou Creative Commons
  • spropagovať myšlienku využívania opensource riešení v štátnej správe
  • spustiť "supportné centrum" pomáhajúce budúcim používateľom systému integrovať ho s ich systémami
  • zapojiť sa do procesu participatívneho rozpočtu pre Bratislavu

 

Prvá etapa - definícia formátov pre zdieľanie informácií a výber vhodnej OSS technológie

Navrhované riešenie obsahuje open source balík a metodiku nasadenia, poskytujúcu organizácii (ministerstvo, obec, nezisková organizácia, súkromná firma) nástroj na zverejňovanie dát z interných systémov. V prvej fáze sa zabezpečuje publikovanie verejných informácií pomocou otvorených štandardov (napr. verejne dostupné zmluvy, príjmové a nákladové položky, účtovné dáta, vyhlášky atď.)

Každá organizácia si sama zvolí aké dáta bude publikovať a v akých intervaloch ich bude aktualizovať. Veríme, že otvorená komunikácia medzi organizáciami a verejnosťou vytvorí rozumný kompromis medzi uzavretosťou a otvorenosťou informácií.

Momentálne je to práve oblasť katalogizácie knižničných a kultúrnych diel, kde zverejňovanie digitálnych dokumentov dosahuje svoj vrchol. Ak by sme však myšlienku scanu obrazu v galérii zamenili za scan faktúry na mestskom zastupiteľstve, vieme jednoducho aplikovať výsledky výskumu a vývoja z kultúrnej oblasti práve na tématiku Open Data. Preto napríklad z kultúrnej oblasti preberáme zadefinovaný komunikačný štandard Open Archives InitiativeProtocol (OAI-PMH). Tento komunikačný štandard je vhodný pre tzv. read-only zverejňovanie údajov.

Riešenie tiež poskytuje prístup k údajom pre aplikácie tretích strán, aby sa zverejnené Open Data využívali viac a lepšie. Aj v tomto prípade ide o prevzatie overených konceptov z iných sfér (Web 2.0, sociálne siete, ...).

Obdobne je pre dáta vstupujúce do riešenia zadefinované aj otvorené rozhranie určené na vývoj nástrojov na spracovanie tých dát, ktoré používajú špecifické a málo rozšírené formáty.

Týmto spôsobom je možné poskladať riešenie projektu OpenData z existujúcich a overených open source technológií a štandardov a prevádzkovať ho tak  aj v najväčších slovenských organizáciach (ministerstvá, veľké firmy).

Súčasťou riešenia je aj analýza bezpečnosti a vypracovanie doporučení pre nasadenie riešenia v rôznych druhoch organizácií. Referenčná implementácia riešenia bude nasadená vo vybraných subjektoch a následne bude otestovaná a certifikovaná.

Predpokladáme, že sa nám pre potreby riešenia OpenData podarí využiť potenciál existujúceho slovenského open source balíka Custodea, ktorý rieši problematiku digitálneho zverejňovania v kultúrnom sektore.

Architektúra riešenia

Ako to funguje

  • Nainštalovaný balík (open source) aplikácií - Open Data Node - zbiera dokumenty a metadáta o nich, spracúva ich a poskytuje verejnosti, inštitúciám aj ďalším aplikáciám.
  • Dokument sa do Open Data Node môže dostať viacerými spôsobmi:
    • Používateľ vloží dokumenty a vyplní pre ne metadáta cez webové rozhranie.
    • Open Data Node, prostredníctvom Harvestera monitoruje definované zdroje a automaticky zbiera a spracúva (OCR, extrakcia metadát, konverzia, previazanie s registrami atď.) zverejnené dokumenty.
    • Autorizovaní používatelia kontrolujú, komentujú a dávajú prípadné návrhy na opravu či úpravu zozbieraných dokumentov, čím vytvárajú obsah vo vyššej kvalite, s prípadnými anotáciami a doplnenými väzbami (referenciami).
  • Zdrojom dokumentov (a dát vo všeobecnosti) sú všetky zverejnené údaje v rámci informačných systémov inštitúcií a webových stránok - verejná správa, štátna správa, tretí sektor, ale aj vybrané informácie zo súkromných zdrojov. Väčšina v súčasnosti publikovaných faktúr z verejného sektora či príspevkových organizácií je zverejnená v podobe skenovaných faktúr. Tieto sú kandidátom na vyťažovanie pomocou OCR, alebo výstupov z účtovníctva, ktoré vie harvester spracovať priamo.
  • Dôležitým zdrojom informácií sú verejné registre, ako je Obchodný register, registre Štatistického úradu a pod., ktoré umožnia referenčnú integritu zozbieraných dokumentov a ich metadát.
  • Sprístupnenie zozbieraných dát má niekoľko úrovní:
    • poskytovanie pre harvesting (OAI-PMH, FTP, HTTP, ...) ďalšími systémami (napr. aj iné Open Data Node)
    • poskytovanie formou služieb, cez štandardné rozhrania ako sú WebServices, REST a pod. v rôznych formátoch (XML, JSON, ...) pre maximálne zjednodušenie aplikácií tretích strán, ktoré budú chcieť využívať zozbierané Open Data
    • poskytovanie dát a služieb s pridanou hodnotou cez web rozhranie (browsovanie)
    • dávkový export (vybranej podmnožiny) metadát do zvoleného formátu (RDF/XML, SKOS, DublinCore)
  • Prezentácia zozbieraných dát: samotný Open Data Node bude prezentovať v ňom uložené (evidované) dáta niekoľkými spôsobmi:
    • ako jednoduchý zoznam "odkazov" ktoré vyhovujú zadanému filtru (google-like)
    • fazetové browsovanie / filtrovanie (podľa rôznych kategórií - pôvod dokumentu, typ dokumentu, dátum dokumentu atď.)
    • zobrazenie na mape (pre dokumenty ktoré sú previazané na geografickú lokalitu, napr. stavebné povolenie, sídlo firmy atď)
    • zobrazenie na časovej osi (pre dokumenty ktoré obsahujú časový údaj, napr. splatnosť faktúry, dátum podpisu zmluvy)
    • tabuľka s vybranými stĺpcami, vrátane možnosti exportu do formátu CSV (Excel a pod.) alebo XML
  • Portál: zoznam inštitúcií pripojených k iniciatíve treba evidovať v zozname, pre začiatok bude použité jednoduchšie riešenie vo forme Wiki alebo blogu, neskôr je ale potrebné zaviesť formalizovaný adresár
  • Otvorená architektúra: jednotlivé komponenty architektúry, ako aj jednotlivé inštalácie systému (Open Data Node) sú voľne integrovateľné do hierarchie (kaskády, ...), čím sa dosiahne maximálna flexibilita čo do typu a účelu zbieraných dát (segmentové resp. sektorové systémy, napríklad pre zdravotnícke dáta, školstvo, regionálne dáta atď.) a tiež čo do spôsobu (pred-)spracovania vstupných dát - OCR, extrakcia, formáty, veľkosti, validácia, limity.


Ilustrácia zapojenia viacerých Open Data Node do hierarchie