Datový repozitář

Charakteristika Repozitáře ASEP

ASEP je institucionální datový repozitář Akademie věd České republiky, ve kterém jsou uloženy  datové soubory opatřené metadaty (popisem) autorů ústavů AV ČR.  Umožňuje verzování datových souborů a propojení datových a bibliografických záznamů. Je registrován v registru datových repozitářů RE3DATA.

Data uložená v databázi jsou zveřejněna v online katalogu a opatřena persistentními identifikátory handle (všechny záznamy v ASEP) a DOI (datové záznamy uložené přímo v ASEP). Metadatový popis jednotlivých záznamů vychází ze standardu UNIMARC a je kompatibilní s metadatových schématem Datacite. Metadata všech záznamů jsou volně přístupná.

Podrobný popis jednotlivých polí metadatového záznamu

Provozovatel repozitáře

Správu a služby týkající se repozitáře zajišťuje Knihovna AV ČR. Za ukládání dat na jednotlivých ústavech  AV ČR jsou zodpovědné pověřené osoby (zpracovatelé ASEP). Pracovníci knihovny školí zpracovatele ASEP na jednotlivých ústavech AV ČR, poskytují podporu a vytváří návody.

Ukládání datasetů

Do repozitáře ASEP mohou ukládat datové soubory opatřené metadaty všichni autoři, kteří působí na pracovištích AV ČR, případně další pověřené osobyzpracovatelé, individuální zpracovatelé. Vkladatel ukládá metadatové záznamy a datové soubory do repozitáře přes individuální účty.

Postup při ukládání datových záznamů do ASEP

Smlouvy, licence a přístup

Do repozitáře ASEP mohou ukládat výzkumná data opatřená popisem (metadaty) pracovníci ústavů AV ČR, které mají podepsánu Rámcovou smlouvu o využívání repozitáře ASEP k ukládání datových souborů. Seznam pracovišť, jejichž pracovníci mohou využívat repozitář k ukládání datesetů.

Před uložením dat do repozitáře musí vkladatel odsouhlasti Dohodu o uložení datasetů do datového repozitáře ASEP.

Přístup

ASEP umožňuje 4 možnosti přístupu k uloženým souborům.

1. Veřejně přístupný:  Datové soubory jsou v online katalogu přístupné všem.

2. Přístupný pro ústav: Soubory jsou přístupné z IP adres ústavu který je vložil.

3. Veřejně přístupný s embargem:Soubory jsou veřejně přístupné po uplynutí stanovené doby.

4. Veřejně nepřístupný (na vyžádání): Soubory jsou nepřístupné. Je možné u vkladatele požádat o zpřístupnění souborů.

 

Licence

V DR ASEP je možné zvolit z licencí Creative Commons.

Případně je možné využít vlastní licence. V tom případě musí být k datovým souborům přiložen text licence pojmenovaný licence.pdf.  Pokud je u záznamu zvolena Creative Commons nebo jiná otevřená licence musí být uložené soubory veřejně přístupné.

Podrobnější informace o licencích

 

Uložení dat

Uložení dat přímo v ASEP

V repozitáři ASEP může být uložen datový záznam a dataset. Je možné uložit datový záznam a odkaz na datasety v jiném repozitáři.

Odkaz na data v jiných repozitářích

V datových záznamech lze uvést odkazy na bibliografické záznamy uložené v ASEP i na datasety v jiných úložištích.

V bibliografických záznamech lze uvést odkazy na datasety uložené v repozitáři ASEP, ale i na datasety, které jsou uloženy na jiných úložištích.

Velikost, formáty,pojmenování

Velikost

Maximální velikost jednoho ukládaného souboru je 50 GB.

Po domluvě se správcem repozitáře lze uložit i soubory větší velikosti – kontakt arl@lib.cas.cz)

 

Formáty a pojmenování souborů

Datové soubory je třeba uložit  komprimované ve formě zip archivu.  Soubory s licencí (licence.pdf), a soubory obsahující dokumentaci není nutné komprimovat. Ukládané soubory měl být vhodně pojmenované. Název by měl vystihovat obsah ukládaných souborů.Názvy souborů  musí být bez diakritiky, bez mezer, podtržítka jako separátor, maximální délka názvu souboru 127 znaků.

Aby byl zajištěn dlouhodobý přístup a využitelnost dat v repozitáři, je vhodné u souborů používat standardní  formáty, které zaručují dlouhodobou ochranu. Formáty vhodné pro dlouhodobou ochranu jsou především ty, které jsou otevřené, dobře zmapované a mají širokou podporu ze strany výrobců softwaru. Při výběru vhodných formátů je nejvhodnější držet se doporučení komunity s ohledem na dobrou praxi a obecně přijímané standardy.

Technické parametry a zabezpečení dat

Software
Asep využívá  modul „Evidence publikační činnosti“ knihovního systému Advance Rapid Library (ARL).

Zabezpečení metadat je na úrovni databáze IRIS a její kontroly práv pro přístup z aplikace ARL.

Data uživatelů jsou v šifrované části databáze. Databáze je automaticky zálohována dle nastavení v plánovaných úlohách. ARL splňuje standardy GDPR.
Digitální obsah repozitáře (soubory uložené v Content serveru) je z pohledu aplikačního zabezpečen přístupem přes Content server gateway, řízeným konfigurovatelnými pravidly. Z pohledu uložení je obsah zabezpečen na úrovni file systému, nastavení adresářových oprávnění v operačním systému a zálohovací politiky správce virtuálního serveru, čili spadá pod Veeam zálohy.
Archivace je zajištěna tím, že se v Content serveru udržuje celá historie verzí uložených souborů, nikdy se nevymazávají.
Přenos dat mezi prohlížečem klienta a serverem ARL je zabezpečen šifrovaným protokolem https, s automatickou obnovou certifikátů Let’s encrypt.

Virtuální servery, na kterých beží ostrá instalace a shadow kopie (geograficky oddělené databáze) jsou zálohovány standardně prostředky zálohovací infrastruktury KNAV – konkrétně nástroj VeeamBackup.