Datový repozitář

1. Datový repozitář ASEP
2. Ukládání datasetů
3. Datové záznamy v online katalogu
4. Verzování záznamů
5. Správa repozitáře


1. Datový repozitář ASEP

Datový repozitář ASEP je institucionální  repozitář, ve kterém jsou uloženy bibliografické záznamy o výstupech, plné texty dokumentů a datové soubory opatřené metadaty (popisem) autorů ústavů AV ČR. Správu a služby týkající se repozitáře zajišťuje Knihovna AV ČR. Data uložená v databázi jsou zveřejněna v on-line katalogu .

Ústavy mají podepsanou Rámcovou smlouvu o využívání repozitáře ASEP k ukládání datových souborů. Seznam pracovišť, jejichž pracovníci mohou využívat repozitář k ukládání datesetů.

2. Ukládání datasetů

Do repozitáře ASEP ukládají datové soubory a datasety vkladatelé, což jsou všichni autoři, kteří působí na pracovištích AV ČR, případně další pověřené osobyzpracovatelé, individuální zpracovatelé.

Vkladatel ukládá metadatové záznamy a datové soubory do repozitáře přes individuální účty.

  • Vkladatel se seznámí s licenčním ujednáním pro autory, pokud s ním souhlasí, požádá si o vytvoření individuálního uživatelského účtu myASEP. Dohoda o uložení datasetů do datového repozitáře ASEP zde.
  • Individuální účet se vytvoří vyplněním  formuláře předregistrace na hlavní stránce on-line katalogu. Zpracovatel pracoviště (supevizor pracoviště) registraci zkontroluje a následně žadateli přijde e-mail o aktivaci individuálního účtu.

Aktivace individuálního uživatelského účtu (IU)

Vytvoření individuálního uživatelského účtu je plně v kompetenci zpracovatele pracoviště.

  • Zpracovateli obdrží e-mail, ve kterém je žádán o potvrzení registrace vkladatele.
  • Pokud se jedná o pracovníka ústavu, zpracovatel aktivuje individuální účet vkladatele .
  • Vkladateli následně přijde e-mail, že má vytvořen uživatelský účet.
  • Pokud vkladatel přestane být zaměstnancem, měl by být jeho účet zrušen.

Příprava, tvorba, kontrola, zveřejnění

Na obrázku 1 je zjednodušené schéma zpracování:


Důkladná příprava metadat a datasetů je prvním a zcela zásadním krokem, připravili jsme několik příkladů postupu (pro autory).

Co si musí vkladatel uvědomit a zkontrolovat před uložením/zveřejněním dat:

  • Máte všechna potřebná práva pro zpřístupnění dat?
  • Máte souhlas spoluautorů a ostatních držitelů práv k datům?
  • Máte uvedeny všechny nezbytné informace v metadatech tak, aby citace, která bude u dat k dispozici byla správná a úplná?
  • Máte dostatečně anonymizována svá data, nebo výslovný souhlas od všech subjektů, jejichž totožnost by mohla být odhalena z dat?
  • Znáte svá práva a povinnosti při ukládání dat do repozitáře a jste s nimi srozuměni?
  • Můžete dokázat, že máte všechna práva k uložení dat v datovém repozitáři? V případě, že KNAV obdrží důkaz o porušení autorských práv, příslušná položka(y) budou ihned odstraněny.
  • Jste si vědomi, co vyplývá ze Smlouvy o využívání repozitáře ASEP k ukládání datových souborů, pokud jde o uchovávání, migrace souborů a odebrání položek?

Příprava datového záznamu (metadat) a datasetů

  • Struktura metadatového záznamu je podrobně popsána v manuálu. U každého záznamu se musí vyplnit povinná pole a pole podmíněně povinná.
  • Licence je pole, kde vkladatel určuje, jakým způsobem může uživatel, který si data stáhne, nebo vyžádá s daty pracovat. Vkladatel si musí rozmyslet jakou licenci nastaví pro práci s datasety. K výběru jsou licence Creative Commons, případně může vkladatel přiložit text vlastní licence – dokument formátu .pdf. Pokud se vyskytne licence, které by mohla být přidána do seznamu licencí (jako je to u licencí CC), obraťte se na arl@lib.cas.cz.
  • Přístup k souborům: veřejně přístupné, přístupné pro ústav na vyžádání, s embargem – veřejně zpřístupňujeme až po určité době. Pokud je zvolena licence Creative Commons nebo jiná otevřená licence, musí být soubory veřejně přístupné.
  • Pro datasety je důležité, aby byla vhodně zvolena velikost a formáty souborů, případně i jejich počet. Maximální velikost jednoho ukládaného souboru jsou 50 GB. Po domluvě se správcem repozitáře lze uložit i soubory větší velikosti.  Je vhodné zvolit formáty, které se běžně využívají v daném oboru. Pokud se ukládá větší počet souborů, je vhodné je komprimovat ( zip).
  • Název souborů:Ukládaný soubory měl být vhodně pojmenované. Název by měl vystihovat obsah ukládaných souborů.Názvy souborů  musí být bez diakritiky, bez mezer, podtržítka jako separátor, maximální délka názvu souboru 127 znaků.
  • V repozitáři ASEP může být uložen datový záznam a dataset. Je možné uložit datový záznam a odkaz na datasety v jiném repozitáři.

 

Propojení datových a bibliografických záznamů

  • V bibliografických záznamech lze uvést odkazy na datasety uložené v repozitáři ASEP, ale i na datasety, které jsou uloženy na jiných úložištích, a naopak.

 

Odkaz na datový záznam ve formulář pro zápis bibliografických záznamů.

Uložení záznamů a datasetů z myASEP

Uživatelský účet myASEP

 

  • Vkladatel může vytvořit nový datový záznam (metadata) + uložit dataset do ASEP, nebo odkaz do jiného repozitáře. Dokud záznam neodešle ke zveřejnění zpracovateli, má ho uložen mezi rozepsanými záznamy. Rozepsané záznamy může editovat a mazat.
  • Pokud se vkladatel rozhodne data zveřejnit v on-line katalogu ASEP, předá data ke kontrole zpracovateli. Jakmile záznam odešle zpracovateli ke kontrole, záznam již nemůže editovat a mazat, záznam se přesune mezi záznamy předané ke kontrole.

3. Datové záznamy v on-line katalogu

  • Pokud jsou data v pořádku, zpracovatel potvrdí zveřejnění datového záznamu (odešle záznam do IPAC).
  • Systém přidělí datovému záznamu identifikátor handle a dataset je zveřejněn v on-line katalogu. Uživatelé si mohou datasety vyhledat, stáhnout nebo požádat o jejich poskytnutí.
  • Identifikátor DOI (Digital object identifier) přiděluje KNAV ručně.

Datasety lze v on-line katalogu vyhledat v rozšířeném vyhledávání výběrem limity „dataset“. Limitu „dataset“ lze libovolně kombinovat s ostatními limitami, tak lze najít datasety, které se váží např. k projektům, pracovištím apod.

U vyhledaného datového záznamu lze zobrazit všechny údaje, které jsou uloženy v datovém formuláři. K dispozici jsou různé zobrazovací formáty: základní, základní s s popisem, citace dat. Pokud se ukládá dataset s větším množstvím souborů, doporučujeme je „zabalit“ do jednoho souboru (.zip, .rar). U každého souboru je zobrazena velikost souboru, typ souboru, počet stažení a přístup a jakým způsobem může se soubory pracovat. U souborů na vyžádání – uzavřený zámek – pro získání souboru musí uživatel požádat autora o zaslání datasetu (vyplnění formuláře).

 

Vyhledávání datových záznamů v ASEP.

Příklad propojení  bibliografického a datového záznamu v ASEP.

Příklad propojení datového a bibliografického záznamu v ASEP.

Pravidla pro uživatele datového repozitáře:

Data v repozitáři jsou k dispozici na základě licence uvedené u jednotlivých zdrojů (položek). Uživatel před tím, než si stáhne vystavené soubory, musí potvrdit (zaškrtnutím políčka „souhlasím“), že bude se soubory pracovat dle uvedené licence – zde. Uživatelé jsou povinni dodržovat licence, které jsou uvedeny u datových souborů v repozitáři a uživatel pokud je použije je povinen je citovat.

Pravidla pro citace:  Záznamům  v datovém repozitáře persistentní identifikátory handle a DOI. Každá citace dat musí obsahovat handle a DOI, vedoucí k záznamu metadat příslušného datového záznamu.

4. Verzování záznamů

  • Datový repozitář ASEP umožňuje verzování datových záznamů.
  • Nová verze se vytváří pouze při změně uložených dat, nikoliv metadat.
  • Nové verzi jsou přiděleny jedinečné identifikátory handle a DOI.
  • Nová verze je v ASEP propojena s verzí původní.

5. Správa repozitáře ASEP

Uživatelská podpora

  • Veškerou podporu zajišťují zaměstnanci KNAV.
  • Uživatelé mohou své dotazy a připomínky zadávat buď vyplněním formuláře na hlavní stránce on-line katalogu, pro nebo je k dispozici hot-line zasláním e-mailu na adresu arl@lib.cas.cz.
  • Řešení dotazu a připomínek obdrží uživatelé e-mailem.
  • KNAV zajišťuje pro zájemce školení a semináře.