Publikování a sdílení dat v režimu otevřeného přístupu, který umožňuje okamžitý, bezplatný, trvalý a neomezený přístup k vědeckým výsledkům, je celosvětově stále více podporováno jak vědeckými institucemi, tak poskytovateli finanční podpory. Zpřístupnění dat dle principů FAIR neznamená zpřístupnění dat bez jakýchkoliv omezení. Cílem je následovat princip, tj. data zpřístupňovat:
„…as open as possible, as closed as necessary“
„…tak otevřeně, jak jen to je možné, tak omezeně, jak je to nezbytně nutné“.
Výzkumná data by, v souladu s touto zásadou, měla být zveřejňována v takovém rozsahu, který maximálně umožní jejich opětovné užití. Na druhou stranu ale může být zveřejnění omezeno, a to právě v rozsahu, který je nezbytný pro ochranu práv a zájmů příjemce, poskytovatele a třetích osob. Mezi tato chráněná práva a zájmy patří typicky právo na ochranu osobních údajů, ochrana bezpečnosti státu, nebo třeba zájem na monetizaci a zužitkování výzkumu institucí, která jej provedla.
Výzkumnými daty se podle Zákona 130/2002 o podpoře výzkumu, experimentálního vývoje a inovací (§ 2 Vymezení pojmů, Odstavec 2 písmeno o) rozumí „informace v elektronické podobě, které jsou shromažďovány nebo vytvářeny v průběhu výzkumu, jsou používány jako důkazy nebo které jsou obecně akceptovány výzkumnou obcí jako nezbytné k validaci zjištění a výsledků.“
Evropská směrnice o otevřených datech definuje data následovně: “Výzkumná data (údaje z výzkumu) – zahrnují statistiky, výsledky pokusů, měření, pozorování vyplývající z práce v terénu, výsledky průzkumů, jakož i zvukové a obrazové záznamy z pohovorů. Zahrnují též metadata, specifikace a jiné digitální objekty. Výzkumná data se liší od vědeckých článků, které přinášejí zprávy o zjištěních, jež jsou výsledkem vědeckého výzkumu, a tato zjištění též komentují.”
Výzkumná data by měla naplňovat FAIR principy. Tyto principy popisují, jak by data měla být zpracována, aby byla dohledatelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable). Data by měla disponovat standardními formáty, měla by být opatřena metadaty a perzistentními identifikátory (DOI, handle).
S FAIR principy není v rozporu, pokud je přístup k datům podmíněn splněním podmínek (např. podpisem smlouvy a dodržováním smluvních omezení atp. – pokud jde o omezení, která jsou nezbytně nutná a transparentně vysvětlená např. v DMP).
Přestože vědecké články samy o sobě nejsou považovány za výzkumná data, je třeba s nimi také zacházet podle FAIR principů, zejména co se týká vyhledatelnosti a dostupnosti. Je nanejvýš doporučeníhodné s FAIR principy pracovat už od začátku výzkumu.
Podrobný popis FAIR principů v angličtině najdete na webu Go FAIR, na který vedou taktéž odkazy v následujícím přehledu FAIR principů.
Pokud mají být data opětovně využitelná, pak je třeba zajistit, že je jak lidé, tak stroje budou moci najít. Pro tento účel jsou klíčová strojově čitelná metadata. Každý výstup by měl mít jedinečný a trvalý identifikátor, například DOI (Digital Object Identifier), který zajišťuje, že lze data spolehlivě nalézt i po delší době. Umělecké výzkumné výstupy, jako jsou obrazy, zvukové stopy nebo multimediální projekty, musí být opatřeny kvalitními metadaty, která usnadní jejich nalezení. Trvalé identifikátory, jako DOI, zajistí dlouhodobou dohledatelnost nejen v akademických databázích, ale i v kulturních a kreativních odvětvích.
Data a výstupy musí být přístupné uživatelům, a to i v případě, že je s nimi spojena ochrana přístupu (např. kvůli citlivosti dat). To se obvykle řeší jasně definovanými licencemi a vhodným řízením přístupových práv. Klíčové je, aby metadata zůstala přístupná vždy, i když samotný obsah může podléhat omezením. Například pro umělecký výzkum by mohlo jít o zajištění přístupu k multimediálním výstupům pomocí licencí, jako je Creative Commons, které uživatelům jasně vymezují možnosti využití.
Aby data mohla být využita napříč různými systémy, musí být zaznamenána v kompatibilních a standardizovaných formátech. Použití otevřených datových formátů (např. XML, JSON) a srozumitelných metadatových standardů umožňuje snadnou výměnu informací. V oblasti uměleckého výzkumu to může zahrnovat například použití standardů Dublin Core pro popis uměleckých děl, scénářů či hudebních skladeb, což umožňuje sdílení a zpracování dat v rámci různých platforem.
Výstupy by měly být co nejvíce znovupoužitelné, což znamená jasnou dokumentaci, konzistentní formáty a použití licencí, které umožňují opakované využití. Důležité je také poskytovat kontext a informace o původu dat (provenience). V uměleckém výzkumu jde například o sdílení datasetů obrazových či zvukových záznamů nebo videí s odpovídajícími metadaty, která poskytují dostatečný kontext, aby mohli další badatelé navázat na předchozí práci.
Zde najdete jednoduchý sebehodnotící nástroj pro zhodocení FAIR dat. Pomocí něj můžete zhodnotit "FAIRovost" svých dat, popřípadě určit, jak můžete FAIR principy lépe implementovat.
S postupným pronikáním postupů otevřené vědy do akademické praxe též rostou nároky na nakládání s vědeckými daty. Základním nástrojem, který má usnadnit správu vědeckých dat, je tzv. plán správy dat (Data management plan - DMP). Tento nástroj nachází typické uplatnění v přírodních nebo sociálních vědách, nicméně je třeba jej aplikovat i v případě humanitních věd a uměleckého výzkumu. Poskytovatelé grantových titulů (u nás typicky MŠMT - OP JAK, GAČR či TAČR) jej totiž vyžadují jako povinnou přílohu odevzdávanou v různých fázích grantu.
DMP tedy plní na jednu stranu roli dokumentace pro poskytovatele grantu (z pohledu výzkumníků*ic se tedy jedná o další povinnost), na stranu druhou však jde také o živý dokument, který má pomoci výzkumníkům*icím promyslet úskalí nakládání s výzkumnými daty a připravit je na některé problematické aspekty, jako například problematiku autorských práv, GDPR, zálohování či systematické značení dat. DMP má tedy potenciál rozšířit dosah dat a tedy celého výzkumu.
Zásadní otázka je, co si výzkumníci*ice mají představit pod pojmem data. V přírodních či sociálních vědách je situace jednodušší - jde o výsledky měření, odpovědi na dotazníky, databáze, tabulky, grafy atd. V humanitních vědách či uměleckém výzkumu se může stát, že výzkumníci*ice s podobnými daty vůbec nepracují. Co tedy mají chápat pod pojmem výzkumná data? Jedná se o jakékoli vstupy, které jsou použity ve výzkumu. Může se jednat o primární či sekundární literaturu, ale též scany archivních dokumentů, fotografie, databáze, tabulky, soupisy, výpisky z literatury nebo audionahrávky. Protože poskytovatelé grantů požadují, aby všechna relevantní data byla publikována společně s výzkumem, je třeba, aby výzkumníci*ice zvážili*y, co je třeba publikovat. Přitom je nutné dbát jak na relevanci dat, tak na autorská práva a citlivá data. Obecně lze říci, že by měla být data publikována v takovém rozsahu, aby bylo možné ověřit daný výzkum. Některá data publikovat nelze (např. archivní dokumenty), jiná zase není třeba (literatura). DMP pak funguje jako dokument, v němž si výzkumníci*ice ujasní, jak s daty budou nakládat a zároveň svůj postup vysvětlí též poskytovateli grantu.
Pokud uvažujete o grantových titulech OP JAK, GAČR atd., je vhodné v týmu ustanovit datastewarda, tzn. osobu, která bude zodpovědná za vyplňování DMP a jeho aktualizaci a dále též za správu výzkumných dat. Mzdové náklady na datastewarda obvykle patří k uznatelným nákladům a je třeba na ně při psaní grantů pamatovat. S touto problematikou vám rádi poradíme - open.science@amu.cz.
Zpracováno podle KNAV (CC-BY)
Akademie múzických umění v Praze
Malostranské náměstí 259/12
118 00 Praha 1
IČ: 61384984
DIČ: CZ61384984
ID datové schránky: ikwj9fx