Úloha: Na základe plánu zverejňovania zverejňovať datasety na portáli otvorených dát.
Zodpovední: ministri, predsedníčka Úradu geodézie, kartografie a katastra SR, predsedníčka Štatistického úradu SR, predsedníčka Úradu pre verejné obstarávanie
Termín: 31. december 2015
Pre organizácie, ktoré sa snažia zvrejniť zmysluplné dáta, plynú viaceré výhody:
- Menej "info žiadostí". Skúsenosti zo zahraničia hovoria, že vtedy, keď sú dáta dostupné verejnosti, zníži sa dopyt prostredníctvom FOIA žiadostí (žiadostí podľa "infozákona"). Niektorí občania radšej využijú služby data portálu namiesto toho, aby strácali časť čakaním na odpoveď od úradu.
- Dobré vzťahy s verejnosťou. Toto je bod, ktorý zaujme politikov: ak sú občania spokojní, zvyšuje to ich kredit. Ak organizácia poskytuje dôležité dáta, je sama vnímaná ako dôležitá a zaisťuje si tým financovanie pre budúcnosť.
- Lepšie fungujúca verejná správa. Aj na Slovensku sa stretávame s tým, že úradníci strácajú čas, keď musia zháňať ťažko dostupné údaje z iných verejných organizácií alebo strácať čas konverziou z nevhodných formátov (napr. z tabuliek v PDF súboroch). Keď sú dostupné aktuálne údaje v otvorených formátoch, ušetrený čas sa dá stráviť lepšie.
- Dodržiavanie legislatívy. Slovenská republika preberá legislatívu EÚ a prijíma svoje vlastné normy, ktoré vytvárajú tlak na publikovanie dát. Tento tlak sa v priebehu času nebude znižovať, ale zvyšovať. Je preto vhodné nastaviť v organizácii systém proaktívneho zverejňovania údajov. Veľa úloh sa dá automatizovať: informačný systém sa môže rozšíriť tak, že bude dáta exportovať pravidelne, bez potreby ručného zásahu. Jednorázový úkon často zabezpečí, že aktuálne dáta budú k dispozícii až do výmeny informačného systému.
- Možnosť získať finančné zdroje pre IT. V novom programovom období (2014-2020) budú na otvorené dáta k dispozícii finančné zdroje z fondov EÚ. Publikovanie otvorených dát sa dá bezplatne a pohodlne realizovať už dnes, no na rozbeh rozsiahlejších IT služieb môže byť potrebná investícia.
Z uvedeného je vidieť, že otvorené dáta neprinášajú výhody len občanom, aktivistom a podnikateľom, ale prinášajú výhody aj samotným organizáciám, ktoré dáta zverejňujú a taktiež aj verejnej správe ako celku.
Pri publikovaní údajov je dôležité položiť si nasledovné otázky:
- Kto by mal na tejto úlohe participovať? Za dáta je zodpovedný gestor, ktorý by mal dať aktivite politické krytie. Mal by spolupracovať s IT oddelením, ktoré poskytne súčinnosť pri realizácii.
- Čo sa má zverejniť? Na túto úlohu sa snaží dať odpoveď úloha č. 1 a úloha č. 3. Stručne: najprv dáta, o ktoré je najväčší záujem zo strany verejnosti (pod verejnosťou sa myslí aj neziskový sektor, komerčný sektor a verejná správa, nielen jednotlivci). Neskôr by sa mali zverejniť aj ostatné zmysluplné dáta (a najprv tie, pri ktorých je to technicky a finančne nenáročné).
- Kedy sa majú dáta publikovať? Na toto slúži publikačný plán (úloha č. 1). Upozorňujeme, že je dobré venovať sa problematike seriózne a najmä neodkladať túto prácu na neskôr. Keď vstúpi do platnosti legislatíva, ktorá sprísňuje publikovanie údajov, budú organizácii plynúť zákonné lehoty a hroziť sankcie. Je vhodnejšie pripraviť sa na publikovanie dopredu.
- Kde dáta umiestniť? Na Slovensku sa používa portál data.gov.sk. Na tento sa vždy umiestňujú metaúdaje (informácie o datasete, ako napr. názov, autor a pod. -- toto je dôležité pre vyhľadateľnosť z centrálneho miesta) a dáta môžu byť uložené buď na data.gov.sk alebo vlastných serveroch organizácie (typicky na bežnom webovom serveri vo vyhradenom adresári).
- Ako postupovať? Dáta môže do otvoreného formátu vyexportovať informatik (formáty popisuje Výnosu MF SR o štandardoch pre ISVS č. 55/2014 Z. z. § 51-53 a Príloha č. 9), čo je vhodné pre jednorázové dáta, ktoré sa už nebudú meniť. Ak sa dáta menia v čase, je lepšie použiť automatizované riešenie, ktoré bude export realizovať automaticky a opakovane (viď informácia o projekte COMSODE nižšie). V prípade, že to okolnosti dovoľujú, môže dodávateľ upraviť samotný informačný systém tak, aby podporoval automatický alebo poloautomatický export do otvorených formátov.
Ministerstvo vnútra je členom projektu COMSODE. V rámci neho vznikol softvér na katalogizovanie a publikovanie údajov Open Data Node a užitočné metodiky pre publikovanie, ktoré sú písané v angličtine (pretože ide o medzinárodný projekt). Pripravujú sa tiež metodiky v rámci projektu eDemokracia a otvorená vláda, ktoré budú písané po slovensky a očakáva sa ich zverejnenie v najbližšej dobe. Pracovná verzia slovenských metodík je už k dispozícii v ÚSVROS na vyžiadanie.
Po exporte dát do otvorených formátov (či už ručne alebo automaticky) je ďalším krokom nahratie datasetu na data.gov.sk. Server data.gov.sk spravuje Národná agentúra pre sieťové a elektronické služby (NASES). Každý rezort, resp. ústredný orgán štátnej správy, by mal NASES požiadať o vytvorenie prístupových údajov. Na toto je potrebné poslať e-mail na adresu [email protected], kontaktná osoba: p. Milan Pikula.
Do zverejnenia údajov či vylepšovania informačného systému odporúčame zapojiť aj budúcich používateľov. Niekedy verejná organizácia začne publikovať údaje alebo sprístupní API, ale nie práve vhodným spôsobom. Ak sa záujmy verejnej správy a jej "zákazníkov" zladia, nastáva spokojnosť na obidvoch stranách. Úrad splnomocnenca vlády pre rozvoj občianskej spoločnosti (ÚSVROS) rád sprostredkuje komunikáciu. Kontaktná osoba: Ján Gondoľ, [email protected]. Pre neformálnu komunikáciu je vhodná napr. aj Facebooková skupina OpenData.sk, v ktorej sú mnohí zástupcovia štátnej správy, samosprávy, ako aj aj softvérových vývojárov. Je to tiež jedno z miest, kde sa dozvedieť o novinkách v oblasti otvorených dát či o podujatiach v tejto oblasti na Slovensku.
Údaje už zverejňujeme na svojom webovom portáli. Máme ich zverejňovať na portáli otvorených dát?
Odpoveď závisí od toho, akým spôsobom údaje zverejňujete. Sú dve možnosti:
- Ak sú dáta cez Váš portál dostupné ako otvorené údaje (tzn. sú dostupné v štruktúrovanej podobe, pod otvorenou licenciou a v otvorenom formáte ako napr. CSV/XML/RDF tak, že spĺňajú požiadavky Výnosu MF SR o štandardoch pre ISVS č. 55/2014 Z. z.), je potrebné, aby bol na Portáli otvorených dát uvedený odkaz na Vaše dáta. Inak povedané: na Vašom serveri sú nahraté údaje samotné a portál data.gov.sk bude obsahovať tzv. metaúdaje (informácie o údajoch samotných, ktoré sú umiestnené na Vašom serveri). Prečo je to dôležité? Kvôli vyhľadateľnosti: niektoré verejné inštitúcie zverejňujú užitočné dáta, no verejnosť o nich nevie, preto je potrebné dáta katalogizovať podobne ako keď knižnica katalogizuje svoje knihy alebo keď Google indexuje stránky na webe. Portál otvorených dát slúži ako centrálny katalóg, cez ktorý je možné dáta pohodlne vyhľadať naprieč verejnou správou bez ohľadu na to, na akých serveroch sú fyzicky umiestnené (napr. na serveri určitého ministerstva či inej organizácie). Takéto centrálne katalógy existujú aj v iných krajinách a dokonca si môžu údaje medzi sebou vymieňať, takže napr. môžete vyhľadávať príbuzné datasety z rôznych krajín v Európe, ale aj mimo nej. Ale prečo je potrebné metaúdaje spísať manuálne, keď Google to urobí automaticky? Kvôli tomu, pretože o mnohých vlastnostiach datasetu máte spoľahlivú informáciu len Vy (kto je správcom? čo presne znamenajú jednotlivé stĺpce v tabuľke?). Niektoré sa dajú síce uhádnuť či vyhľadať inde, no pre zaručenie kvality a elimináciu chýb je ich nevyhnutné vyplniť ručne a uistiť sa, že sa udržiavajú aktuálne. Preto ak sa štruktúra Vášho datasetu zmení alebo sa zmení kontaktná osoba (napr. správca), je potrebné metaúdaje aktualizovať. V opačnom prípade používatelia nebudú vedieť, na koho sa obrátiť v prípade otázok či vtedy, keď nájdu chybu a budú Vám ju chcieť oznámiť.
- Ak sú dáta na Vašom portáli dostupné, ale nie ako otvorené údaje, vtedy je potrebné najprv ich zverejniť v otvorenom formáte a pod otvorenou licenciou (opäť odkazujeme na Výnos MF SR o štandardoch pre ISVS č. 55/2014 Z. z., § 51-53). Prečo to však robiť? Nie je to zbytočná administratíva? Nie je. Ak chýba jasne špecifikovaná licencia, verejnosť nevie, čo môže s údajmi robiť a čo nie. Podnikateľ je teda v právnej neistote a môže mať údaje obavu použiť. Údaje sa však publikujú presne na to, aby sa ďalej používali (inak by to bola zbytočne vynaložená energia), preto je želaným stavom právna istota a jasne stanovené podmienky použitia. Takže špecifikácia otvorenej licencie má zmysel: ak nie sú údaje otvorene licencované, ťažko ich považovať za otvorené (odporúča sa použiť licencie Creative Commons Zero, príp. Creative Commons "uvedenie autora" (CC-BY-4.0), ale toto je samostatná problematika diskutovaná inde). Ďalší krok je použitie otvoreného štruktúrovaného formátu a špecifikovanie metaúdajov. Prečo je to potrebné? Ukážme si príklady: na stránke Ministerstva financií SR sú (v apríli 2015) síce dostupné zoznamy prijímateľov 2% dane, ale tieto sa dajú stiahnuť len vo formáte PDF. Tento nie je štruktúrovaný, preto sa údaje nedajú jednoducho spracovať. Ak by ste si napr. chceli vytvoriť filter a zobraziť riadky tabuľky, kde sú len prijímatelia dane v Liptovskom Mikuláši alebo všetkých, ktorých názov obsahuje slovo "šport", formát PDF nedostačuje. Lepší je formát Microsoft Excel (pretože zachováva štruktúru tabuľky), ale ten má tiež nevýhodu, pretože sa môže považovať proprietárny a vyvoláva právne otázky pri použití v tzv. otvorených / slobodných programoch. Navyše je pre jednoduché štruktúrované dáta po technickej stránke zbytočne komplikovaný, jeho hlavnou výhodou je jednoduchosť použitia pre bežných používateľov. Čo však publikovanie dát cez vlastný webový portál Vašej inštitúcie? Je toto dostačujúce? Ukážme si príklad Obchodného registra: jednotlivé záznamy sú síce verejne dostupné (čo je dobré), dá sa v nich vyhľadávať podľa mena osoby či názvu firmy (čo je výborné), ale podobne ako pri príklade prijímateľov dvoch percent dane sa Vám nepodarí vyhľadať všetky firmy v Liptovskom Mikuláši alebo všetky firmy, ktoré majú konkrétny predmet činnosti. Čo s tým robiť? Na stránke orsr.sk nie je dostupný zoznam všetkých záznamov v Obchodnom registri, preto si ich nemôžete stiahnúť do svojho počítača pre plnotextové prehľadávanie. Taktiež neexistuje verejne dostupné aplikačné programové rozhranie, ktoré by umožnilo vyhľadávanie podľa predmetu činnosti či adresy firmy. Z uvedeného je zrejmé, že nestačí, aby údaje boli "nejako" zverejnené, ale mali by spĺňať určité požiadavky, aby sa s nimi dalo pracovať aj inak, ako zamýšľal pôvodný autor (verejná inštitúcia). Je potrebné, aby mali pripojenú licenciu, aby používali otvorený štrktúrovaný formát a mali aj ďalšie vlastnosti, ktoré sú uvedené vo Výnose MF SR o štandardoch pre ISVS č. 55/2014 Z. z.. Ako sme ukázali na príkladoch, tento výnos nerieši v sekcii o otvorených údajoch (§ 51-53) zbytočnosti, ale minimálne požiadavky pre to, aby sa údaje, ktoré verejná správa publikuje, dali rozumným spôsobom použiť ďalej.