Výzkumná data

Otevřený přístup k vědeckým informacím

Publikování a sdílení dat v režimu otevřeného přístupu, který umožňuje okamžitý, bezplatný, trvalý a neomezený přístup k vědeckým výsledkům, je celosvětově stále více podporováno jak vědeckými institucemi, tak poskytovateli finanční podpory.

Otevřený přístup přispívá ke spolupráci, ověřitelnosti i využitelnosti výsledků tím, že usnadňuje přístup k textům, datům, softwaru, a podporuje tak zvyšování kvality i dopad vědeckých výsledků.

Otevřený přístup k výzkumným datům zahrnuje možnost data volně používat, upravovat a sdílet kýmkoli k jakémukoli účelu.

Data neznamená automatické zpřístupnění dat komukoliv. Cílem je následovat princip “as open as possible, as closed as necessary”, tj. data zpřístupňovat „tak otevřeně, jak jen to je možné, tak omezeně, jak je nezbytně nutné“.

Podrobnější informace o výzkumných datech jsou na stránkách o Open Science v AV ČR

Definice výzkumných dat

Výzkumná data jsou data, která vznikla při řešení výzkumných projektů (z experimentů, šetření a měření …).

Zdigitalizovaná výzkumná data mohou být opatřena metadaty tj. daty, která poskytují podrobné informace o datasetech a licencí tj. pokyny pro uživatele, jakým způsobem může s daty pracovat a uložena v datových repozitářích. V datových repozitářích jsou pro uživatele data dostupná online.

FAIR principy

Výzkumná data sdílená prostřednictvím otevřeného přístupu musí splňovat FAIR principy, které jsou podporovány i významnými poskytovateli financí, například Evropskou Komisí. Principy popisují, jak by data měla být zpracována, aby byla dohledatelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable).

  • Data by měla disponovat standardními formáty, opatřena metadaty a perzistentními identifikátory (PID).
  • Přístup k datům může být podmíněn i splněním nějakých podmínek (např. i podpisem smlouvy a dodržováním omezujících smluvních podmínek).
  • Užití je omezeno licencí stanovujících pravidla nakládání s daty.

Podrobnější informace o FAIR principech na webu Open Science

1. Vyhledatelnost (to be Findable)

Pokud mají být data opětovně využitelná, pak je třeba zajistit, že je jak lidé, tak stroje budou moci najít. Pro tento účel jsou klíčová strojově čitelná metadata.

F1. (meta)datům je přiřazen jedinečný a perzistentní identifikátor (např. DOI, handle)
F2. data jsou popsána dostatečnými metadaty
F3. (meta)data jsou registrována nebo indexována v prohledávatelných zdrojích
F4. metadata specifikují identifikátor

2. Dostupnost (to be Accessible)

K datům by měl být zajištěn otevřený přístup, ideálně prostřednictvím repozitáře. Není – li možné zajistit otevřený přístup k vědeckým datům, pak by měla být volně přístupná alespoň metadata.

A1. (meta)data lze získat pomocí jejich identifikátorů při využití standardních komunikačních protokolů (API)
A1.1 protokol je otevřený, zdarma k dispozici a univerzálně použitelný
A1.2 protokol umožňuje v případě potřeby autentizaci a autorizaci
A2. metadata jsou dostupná i v případě, že data samotná již nejsou k dispozici

3. Interoperabilita (to be Interoperable)

Pro integraci s jinými datasety, pak je vhodné použít standardizované výrazy k popisu dat.

I1. (meta)data používají pro reprezentaci znalostí formální, dostupný, sdílený a široce aplikovatelný jazyk
I2. (meta)data používají slovníky, které se řídí zásadami FAIR
I3. (meta)data obsahují odkazy na další (meta)data

4. Opětovná využitelnost (to be Reusable)

Primárním cílem FAIR principů je zvýšit znovuvyužitelnost vědeckých dat.  K dosažení tohoto cíle je důležité, aby byla data dostatečně popsaná a sdílená pod otevřenou licencí (např. Creative Commons), aby uživatelé dat věděli, jak data vznikla, co popisují a jak s nimi mohou nakládat.

R1. (meta)data mají množství přesných a relevantních atributů
R1.1 (meta)data jsou zveřejněna pod jasnou a dostupnou licencí
R1.2 (meta)data jsou spojena se svým původem
R1.3 (meta)data splňují standardy vědecké komunity pro daný obor
Poskytovatel EU a výzkumná data

Podrobnější informace o požadavcích poskytovatelů naleznete na webu Open Science.

Horizon Europe

Horizon Europe (česky Horizont Evropa) je klíčový program financování výzkumu a inovací v Evropské komise do roku 2027.
Horizon Europe ukládá všem příjemcům povinnost zajistit otevřený přístup k vědeckým informacím (publikacím i datům) a dodržovat principy otevřené vědy.
Informace o povinnostech při komunikaci a šíření výsledků upravuje Modelová grantová smlouvačlánku 17.  Konkrétní povinnosti vztahující se k open science jsou konkrétně uvedeny v příloze 5 smlouvy.

Horizon 2020

Horizon 2020 (H2020, česky Horizont 2020) byl hlavním rámcovým programem Evropské komise na podporu vědy, výzkumu a inovací pro období 2014-2020.
Evropská komise pilotně  v 7. rámcovém programu zavedla povinnost otevřeného přístupu k vědeckým publikacím ve vybraných oblastech. H2020 v tomto na předchozí program navazuje úplnou povinností otevřeného přístupu. Pilotně byla také spuštěna povinnost otevřeného přístupu k výzkumným datům, která se od roku 2017 týká všech účastníků H2020.

Povinnost zajistit otevřený přístup je uvedena v základních dokumentech k H2020:

Povinnost otevřeného přístupu k výzkumným datům v rámci H2020 je uvedena v článku 29.3 modelové grantové smlouvy.

Poskytovatelé ČR a výzkumná data

Obecně poskytovatelé v ČR nepožadují uložení dat, ale jsou zde první vlaštovky – TA ČR a GA ČR. Podrobnější informace o požadavcích poskytovatelů naleznete na webu Open Science.

TA ČR

V program KAPPA na podporu aplikovaného výzkumu, experimentálního vývoje a inovací TA ČR  ve svých podmínkách vyžaduje, aby příjemci zajistili otevřený přístup ke všem výsledkům projektu typu “J” – “recenzovaný odborný článek” a ke všem podpůrným datům souvisejícím s takovými publikacemi. Pro otevřená data a jejich sdílení by měl platit přístup “as open as possible, as closed as necessary”, tedy co nejotevřenější, ale s ohledem na zájmy příjemce, a také by měla být spravována v souladu s principy FAIR. Příjemci jsou povinni do 6 měsíců od zahájení řešení projektu předložit Data Management Plan (DMP, plán správy dat) obsahující popis, jaká data budou vytvořena, zpracována a/nebo sbírána.

Podrobné informace o podmínkách a návod, na splnění podmínek na stránkách TA ČR.

GA ČR

V souvislosti se zaváděním  Směrnice Evropského parlamentu a Rady (EU) 2019/1024 o otevřených datech a opakovaném použití informací veřejného sektoru  se pak v zadávací dokumentaci pro rok 2023 objevují podmínky týkající se nakládání s daty.

Návrh projektu musí  obsahovat stručný popis dat, která v rámci projektu vzniknou a způsobů nakládání s nimi. Zadávací dokumentace dále uvádí, že náklady na správu výzkumných dat a vytvoření Data Management Plan (DMP) patří mezi způsobilé náklady projektu.

Data Management Plan (DMP)

Data Management Plan (DMP)

Popisuje životní cyklus dat sbíraných, vytvořených a zpracovávaných v rámci projektu. Jedná se o plán správy dat, který vytváří hlavní řešitel projektu.
DMP udává, co se bude s daty dít během projektu a po jeho ukončení.

DMP má být živý dokument a měl by být aktualizován, jakmile se objeví závažné změny v průběhu projektu (např. nová data, změna v konsorciálních podmínkách nebo ve složení atd.) a také v době ukončení projektu.

DMP obsahuje informace, které zajistí, že data budou vyhledatelná, dostupná, interoperabilní a znovu využitelná (princip FAIR – findable, accessible, interoperable and re-usable).

Hlavní okruhy DMP:

  • Jaká data jsou uchovávána, zpracovávána, vytvářena a používána,
  • postup při ukládání dat během a po skončení projektu,
  • jaké metodologické postupy a standardy jsou použity (metodologie, jak s daty pracovat),
  • jakým způsobem budou data zpřístupňována,
  • jaké softwarové nástroje byly k vytváření dat použity,
  • jaký software je třeba k prohlížení dat,
  • jak budou data spravována a uchovávána (zahrnuje i dobu po skončení projektu).

Další informace o Data management plánech na webu Open Science.

Nástroje pro organizaci výzkumných dat

Online nástroje pro tvorbu Data management plánu

Knihovna AV ČR nabízí výzkumníkům přístup do komplexního pro tvorbu a správu DMP a správu výzkumných dat Data Stewardship Wizard.

Další informace o DS Wizard na webu Open Science

Další nástroje pro tvorbu DMP

  • DMP online  webový nástroj, který umožňuje vytváření (DMP), jejich sdílení se spoluautory a následný export či zveřejnění. Nástroj obsahuje některé šablony DMP odpovídající požadavkům poskytovatelů financí (Horizont 2020) a rovněž seznam zveřejněných DMP.
  • ARGOS Platforma vytvořená ve spojení OpenAIRE a EUDAT. Tento online nástroj umožňuje snadné vytvoření DMP a popis datasetů. Zde vytvářený DMP využívá služeb a navázaných zdrojů OpenAIRE (např. projekty EU). Je možné využít šablony pro popis dat, např. Horizon2020) Nástroj je propojen s ORCID (přihlášení, vyhledávání výzkumníků a institucí atd).

Další nástroje pro práci s výzkumnými daty

  • FAIR self-assessment tool Nástroj umožňuje pomocí jednoduchých otázek pomůže vyhodnotit, do jaké míry jsou vaše data FAIR.
  • Re3data.org (Registry of Research Data Repositories) Registr repozitářů výzkumných dat poskytuje přehled existujících mezinárodních datových repozitářů a obsahuje užitečné informace, které vám pomohou zvolit vhodný repozitář pro vaše data.
  • AMNESIA je nástroj OpenAIRE pro anonymizaci výzkumných dat. Umožňuje upravit citlivá data tak, aby mohla být sdílena se širokou veřejností a eliminuje riziko porušení práv dalších subjektů. Nástroj umí deduplikovat nahrávaná anonymizovaná data při ukládání do repozitáře ZENODO.