Anbefaling til opbevaringsformater i det kommende DOMS-system.

DOMS-projektet (DOMS står for "Digital Object Management System") arbejder i øjeblikket hen imod en fælles platform for digitale objekter på Statsbiblioteket.

En del af projektet vil være at forsøge at opnå en vis harmonisering af vores forskellige samlinger, hvor det giver mening.

Vi har derfor brug for input fra huset, til vores tanker om hvordan vi opnår dette.

Vi vil bede jer om at læse dette dokument grundigt, og tage stilling til de ting der er foreslået, og komme med forslag og kommentarer overalt hvor det er relevant.

Jeg har i slutningen af dette dokument lavet et skema man kan udfylde med feedback. Jeg håber I vil udfylde skemaet, ikke mindst kommentar-felterne. Jeg vil meget gerne have skemaet senest den 15. september - beklager den korte tidsfrist, men vi har brug for kommentarerne hurtigt, da vi allerede i oktober vil prøve at få det første skelet af et DOMS-system op at køre.

Indledende bemærkninger

Et af de primære formål med det kommende DOMS system er at opnå en harmoniseret tilgang til alle vores digitale objekter, samt at opnå bevaring af dem for eftertiden. Desuden er det et formål at kunne genbruge metoder og komponenter brugt i tidligere projekter når vi starter nye.

En forudsætning for at opnå disse formål er at de digitale objekter vi opbevarer har en fælles kerne af informationer så vi kan tilgå dem på en fælles måde.

Nu er det jo ikke sådan at alle vores data er af samme slags. Afhængig af type, ophav og kontekst er det meget forskellige informationer vi har brug for og til rådighed. Derfor er det ikke muligt eller ønskværdigt at ensrette alle vores objekter til at have nøjagtigt de samme formater og metadata. Det er derimod ønskværdigt at der er en kerne af fælles data, og kun en begrænset mængde af forskellige dataformater.

Det følgende er et oplæg til hvordan vi kan opnå dette. Oplægget er baseret på en omfattende gennemgang af eksisterende digitale materialer på Statsbiblioteket, og et overblik over hvad der kommer i nærmeste fremtid. En oversigt over eksisterende data kan ses på http://merkur/domswiki/Project_summary.

Det er vigtigt at huske, at vi ikke her forsøger at komme med anbefalinger om hvad eller hvordan der skal præsenteres digitale objekter. F.eks. kan WAV-filer være gode til at opbevare lyd i DOMS-systemet, men hvis lyden skal præsenteres for slutbrugere er det måske et bedre valg at bruge MP3-filer eller en "streaming"-løsning. Det er med andre ord i første omgang vores mål at opnå en anbefaling til de autoritative data.

Det er heller ikke sådan at filer man har der ikke lever op til denne anbefaling ikke kan puttes i DOMS. De skal blot konverteres til de endelige valgte formater. Det er vores plan at gemme både den fil der er konverteret til og den oprindelige fil der blev konverteret fra.

Metadata

For alle vores digitale objekter er det selvfølgelig nødvendigt med metadata.

Der er mange ting at beskrive med metadata for digitale objekter, og de strækker sig langt, fra it-rettede metadata om de digitale objekter, til almindelige bibliografiske metadata som vi kender dem fra f.eks. bøger og tidsskrifter.

Digitale objekter er af meget forskellig karakter, og derfor kan alle digitale objekter ikke have helt den samme standard for metadata.

I første omgang fokuserer vi på bibliografiske metadata, hvor vi har brug for input fra huset til at gøre de rigtige valg.

Tre niveauer af metadata

Vores oplæg til at harmonisering af vores data er baseret på en afvejning af ønsket om en fælles repræsentation af data og ønsket om at have data der er meget specifikke for et bestemt projekt eller en bestemt anvendelse.

Vores gennemgang af projekter har vist at vores digitale objekter i det store hele kan deles op i fire hovedtyper af digitale materialer:

  1. Billeder
  2. Lyd
  3. Video
  4. Tekst

Hver af disse typer har forskellige aspekter der er forskellige fra de andre typer. Dermed er det ikke meningsfyldt at repræsentere alle disse typer på samme måde.

Dermed mener vi at der er brug for tre niveauer af metadata:

Niveau 1: Den fælles kerne

På det højeste niveau har vi data der skal eksistere på ethvert objekt, for at sikre en harmoniseret tilgang. Kun et minimum af metadata kan forventes på dette niveau.

Vi foreslår som standard for metadata på dette niveau Dublic Core (http://www.dublicore.com). Ikke alle felter i Dublin Core-standarden vil være relevante for alle objekter, men det menes at Dublin Core giver et rimeligt abstraktionsniveau for forskellige typer objekter. For at sikre mulighed for visning af oversigter foreslår vi at Dublin Core feltet "title" gøres obligatorisk.

Niveau 2: Fælles for objekter af samme type

På dette niveau skal ligge metadata der er fælles for alle objekter af samme type, det vil sige 4 standarder for de fire typer nævnt ovenfor.

Her er der brug for de enkelte afdelingers viden for at vide hvilke formater der er gode. For lyd og video bliver der i radio/tv-projektet i øjeblikket benyttet pbCore (http://www.utah.edu/cpbmetadata/), som muligvis kan benyttes som generel standard. For billeder og tekst er der brug for input om hvad der kunne ønskes.

Det er desuden på dette niveau fil-specifikke metadata opbevares, såsom opløsningen af et billede.

Niveau 3: Projektspecifikke metadata

Projektspecifikke metadata er data som er specifikke for netop denne klump digitale objekter.

Et eksempel kunne være "vort sogns historie" hvor metadata kunne indeholde data om hvilke gårde der er på billederne.

I er selvfølgelig også velkomne ti lat kontakte os, både med spørgsmål og forslag, enten ved at besøge os på 3. sal, eller ved e-mail til Kåre Fiedler Christiansen (kfc@statsbiblioteket.dk) og Toke Eskildsen (te@statsbiblioteket.dk). I kan også indkalde os til et møde for nærmere forklaringer.

File Types

Feedback

Her er et skema hvor det er nemt at se vores anbefalinger, og hvor vi mangler data. Vi håber I efter bedste evne vil give forslag og kommentarer hvor det er relevant for jer.

FeedBackSkema

DOMS data formats (last edited 2010-03-17 13:12:57 by localhost)