Otvorené vedecké dáta
Otvorené vedecké dáta
Otvorené vedecké dáta sú údaje, ktoré môže ktokoľvek slobodne, bezplatne a opakovane využívať a šíriť pod podmienkou uvedenia autorstva a zachovania prístupových práv na ďalšie použitie. Dáta sa zvyčajne vzťahujú na celý rad netextových materiálov a súborov údajov obsahujúcich laboratórne výskumy, testy a pozorovania, štatistické údaje, výsledky prieskumov, modely a pod.
SPARC, nezisková organizácia podporujúca otvorené systémy výskumu a vzdelávania, definuje otvorené vedecké dáta ako dáta, ktoré:
- sú voľne dostupné na internete,
- používateľ môže sťahovať, kopírovať, analyzovať, opätovne spracovávať a používať na akýkoľvek iný účel,
- sú dostupné bez finančných, právnych alebo technických prekážok okrem tých, ktoré sú neoddeliteľnou súčasťou prístupu k samotnému internetu.
Sprístupnenie na opätovné využívanie vedeckých dát umožňuje overiť alebo reprodukovať výsledky výskumu na základe pôvodných údajov, čo posilňuje integritu vedeckého výskumu a prispieva k vyššej kontrole výstupov. Musia byť kvalitné, presne a správne popísané a štruktúrované.
V niektorých prípadoch môže byť prístup k vedeckým dátam obmedzený z dôvodu zachovania súkromia, bezpečnosti a aj z hľadiska dôvernosti. Podobne ako pri iných vedeckých výstupoch, aj dáta by mali byť tak otvorené, ako je to možné a zároveň tak zatvorené, ako je to nutné.
Princípy FAIR
S otvorenými dátami je úzko spojený termín FAIR. Ide o akronym štyroch anglických slov Findable (nájditeľný), Accessible (dostupný), Interoperable (interoperabilný) a Re-usable (opakovane použiteľný). Princípy FAIR sa okrem kvalitatívnych vlastností vedeckých dát vzťahujú aj na metadáta (údaje popisujúce dáta), procesy súvisiace s manažmentom dát a infraštruktúru na zdieľanie dát.
Nájditeľnosť (findability) – základný prvok otvorených výskumných dát:
- (meta)dátam je priradený jedinečný trvalý identifikátor,
- dáta sú popísané metadátami,
- metadáta jasne špecifikujú identifikátor údajov, ktoré opisujú,
- metadáta sú registrované alebo indexované v zdroji, v ktorom sa dá vyhľadávať.
Prístupnosť (accessibility) – jasne definuje, kto a ako môže k dátam pristupovať, overovať si ich a autorizovať:
- (meta)dáta možno vyhľadať podľa ich identifikátora pomocou štandardizovaného komunikačného protokolu (http). Tento protokol:
- je otvorený, bezplatný a univerzálne implementovateľný,
- k treba, umožňuje postup autentifikácie a autorizácie,
- metadáta by mali byť prístupné aj v čase, keď už nie sú k dispozícii dáta, ktoré popisujú (napríklad z dôvodu nečitateľnosti dát).
Interoperabilita (interoperability) – je z hľadiska využívania dát veľmi dôležitá. Dáta sa musia dať integrovať s inými údajmi, zároveň musia vedieť spolupracovať s aplikáciami na analýzu a spracovanie dát. (Meta)dáta by preto mali:
- používať formálny, prístupný a široko použiteľný jazyk na reprezentáciu znalostí,
- používať slovníky, ktoré dodržiavajú zásady FAIR,
- obsahovať odkazy na iné (meta)dáta.
Opakovaná použiteľnosť (reusability) – cieľom FAIR princípov je optimalizácia opakovaného používania dát, ich replikovateľnosť a kombinovateľnosť prostredníctvom presnej dokumentácie:
- (meta)dáta by mali byť bohato opísané pomocou presných a relevantných atribútov,
- (meta)dáta treba zverejniť za jasných licenčných podmienok, ktoré upravujú práva a povinnosti na používanie dát,
- (meta)dáta uvádzajú svoj pôvod (autorstvo), ktorý umožňuje ich citovanie,
- (meta)dáta spĺňajú štandardy relevantné pre danú oblasť výskumu.
Publikovanie vedeckých dát
Dátové repozitáre
V súčasnosti je na výber niekoľko interdisciplinárnych i špecializovaných úložísk. Pri výbere repozitára treba zohľadniť kľúčové záujmy v troch oblastiach:
- cieľová skupina – dáta by mali byť prístupné a ľahko nájditeľné pre tých, ktorí ich budú používať,
- dlhodobá dostupnosť – jasná štruktúra repozitára, dlhodobé uchovávanie a udržateľnosť dátových súborov a strojová čitateľnosť,
- dodržiavanie predpisov – repozitár by mal spĺňať požiadavky, ktoré na ne kladie podoprovateľ výskumu, výskumné pracovisko, časopis, v ktorom autor publikuje.
Viac o dátových repozitároch v článku v časopise Bibliotheca Universitatis.
Dátové časopisy
Cieľom dátových časopisov je podpora vedeckej komunikácie pomocou opakovaného využívania dát, zvyšovania transparentnosti vedeckých metód a výsledkov, odporúčania osvedčených postupov správy vedeckých dát a zabezpečenia ich trvalého uchovávania. Sústreďujú sa výlučne na dôkladný popis dát bez nutnosti ich rozsiahlej analýzy a interpretácie. Neslúžia na archiváciu súborov dát a spravidla vyžadujú, aby pôvodné súbory dát boli uložené vo vhodnom dátovom repozitári, ktorý zabezpečí ich trvalú archiváciu.
Dátové články sú rovnocenným výstupom tradičných vedeckých článkov. Majú jasne definované autorstvo, podliehajú recenznému procesu, možno ich citovať. Poskytujú cenné informácie, ktoré tradičné publikácie a zverejnené súbory dát nemusia zahŕňať.
Viac o dátových časopisoch v článku v časopise Bibliotheca Universitatis.