Datasety

Datasety (velikost, počet, způsob uložení) Další soubory (jiná licence a podrobný popis datasetu) Formáty souborů datasetu Příklad

Předpokládáme, že pokyny pro počáteční nastavení ukládaných datasetů mohou být na základě praxe upraveny. V případně, že potřebujete pomoc s uložením velkého souboru datasetu či převodem souborů na standardní formát, kontaktujte správce repozitáře – arl@lib.cas.cz.

Velikost a počet a způsob uložených souborů

  • Maximální velikost všech souborů uložených k jednomu datovému záznamu je 20 GB.
  • Maximální velikost jednoho souboru by neměla překročit 2 GB.
  • Větší množství souborů (5 a více) doporučujeme zkompripovat (zip, rar). Při prohlížení obsahu zazipovaného souboru v katalogu lze rozbalit přehled všech souborů uložených v zazipovaném souboru.
  • Věnujte pozornost volbě názvu souborů.

Další soubory uložené s datasetem

  • Jiná licence

Pokud se užití souborů uživateli řídí jinou licencí, než jsou licence Creative Commons, musí být znění této licence uloženo v textovém souboru spolu s datasetem. 

  • Soubor popisu datasetu

V datovém záznamu je povinně vyplněné pole „Popis souborů“, které slouží k popisu datasetu. Pokud je potřeba podrobnější popis datasetu, doporučujeme vytvořit textový soubor, který se uloží společně s datasetem.

Doporučení:

  • soubory uložte ve formátu .pdf, nebo .txt
  • zvolte vhodný název souboru:

Pro licenci nejlépe v názvu použijte slovo „licence“, aby se mohl uživatel seznámit s licencí aniž by musel procházet všechny uložené soubory (např. licence_SYSNO_metadat.pdf, licence_akronym_projektu.pdf …).

Obdobně soubor popisu datasetu, ve kterém jsou podrobné informace pro uživatele by měl být jednoznačně pojmenován (např. cti_mne, read.me, popis.txt, description.txt…)

Formáty souborů datasetu

Pro výběru formátu souborů datasetu doporučujeme se řídit těmito obecnými zásadami, které budeme na základě praxe upřesňovat.

Aby byl zajištěn dlouhodobý přístup a využitelnost dat v repozitáři, je vhodné používat standardní formáty, které zaručují dlouhodobou ochranu (LTP – Long Time Period). Formáty vhodné pro dlouhodobou ochranu jsou především ty, které jsou otevřené, dobře zmapované a mají širokou podporu ze strany výrobců softwaru – tj. existuje více programů od různých výrobců, které jsou schopné soubory otevřít a zobrazit. Při výběru vhodných formátů pro LTP je nejvhodnější držet se doporučení komunity s ohledem na dobrou praxi a obecně přijímané standardy.

Doporučené (standardní) formáty souborů kódují informaci způsobem, který je nezávislý na softwaru nebo umožňuje interoperabilitu mezi systémy a aplikacemi. Seznam standardních formátů.

Vybrané formáty (nestandardní) formáty souborů, většina z těchto formátů je široce využívána a je pravděpodobné, že budou moci být uchovány, ale není možné to zaručit. Soubory v těchto formáteh se mohou uložit do repozitáře.  Seznam nestandardních formátů.

Neznámé formáty existuje řada formátů, které nejsou v žádné z našich tabulek, což neznamená, že soubor v tomto formátu nelze uložit.

Při nahrávání neznámých a nestandardních formátů doporučujeme zvážit uložení takových souborů zároveň v některém z podporovaných formátů.