Ingest activiteiten

Uit NCDD WIKI
Ga naar: navigatie, zoeken


Gerelateerd Beleidsuitgangspunt Bitpreservering
Definitie/ Omschrijving Om gedurende het ingesten van digitale objecten in het digitaal archief bit preservering te bewerkstelligen moet een aantal ingest activiteiten worden uitgevoerd zodat het digitale materiaal voldoet aan de eisen van de organisatie.

Bit preservering kent een minimale set maatregelen die dienen te worden uitgevoerd. Daarbij valt te denken aan:

  • Er voor zorgen dat de digitale objecten geen virussen bevatten door de objecten voorafgaand aan de ingest te controleren;
  • Er voor zorgen dat de collectie en de objecten volledig zijn;
  • Formaten identificeren, karakteriseren en valideren.

Weten welke formaten in het digitaal archief zijn opgenomen is fundamenteel in digitale preservering, aangezien veel van de geïdentificeerde risico’s betrekking hebben op bestandsformaten. Er zijn diverse tools beschikbaar waarmee het bestandsformaat van digitale objecten kan worden gecontroleerd, hoewel met wisselend succes.

Het laagste niveau is het bepalen van het bestandsformaat op basis van de extensie, maar dit is geen betrouwbaere techniek. Dit kan worden uitgebreid met analyses door betrouwbaardere tools (zie Aanbevolen Literatuur). Identificatie kan worden uitgebreid met karakterisering en validatie van het bestandsformaat, wat een beter beeld geeft van de inhoud van het digitaal archief.

Waarom Om de integriteit van digitale materiaal te kunnen garanderen,is het van belang dat het digitale materiaal op het moment van ingest voldoet aan de eisen van de organisatie en dat de organisatie kennis heeft van het materiaal dat daadwerkelijk wordt geïngest.
Risico Zonder een minimale set van ingest activiteiten komt de integriteit van het digitale materiaal in het digitale archief in gevaar. Gebrek aan kennis over de bestandsformaten brengt het risico met zich mee dat bepaalde bestanden niet meer toegankelijk zijn met contemporaine toepassingen of toepassingen die door de doelgroep, de Designated Community,  worden gebruikt. Het identificeren van risico’s met betrekking tot bestandsformaten wordt hierdoor ook bemoeilijkt.
Wanneer Maken of Ontvangen  digitaal materiaal, Toekennen beschrijvende metadata & Representation Information
Betrokkenen Technisch Manager: verantwoordelijk voor de beschikbaarstelling van de juiste systemen voor bit preservering

Operationeel Manager/Functioneel Beheerder/System Architect/Technology Operator/Solution Provider : verantwoordelijk voor het beheer van systemen en het uitvoeren van bit preservering

Relaties Functionele preservering

Metadata

Object

Organisatie – Risico management

Toegang

Authenciteit

Voorbeelden British Library: “Ingest valid legacy digital content into our long term repository…” Source: http://www.bl.uk/aboutus/stratpolprog/collectioncare/discovermore/ digitalpreservation/strategy/BL_DigitalPreservationStrategy_2013-16-external.pdf
Discussievragen
  • Beschrijft het duurzaamheidsbeleid van uw organisatie de verschillende ingest activiteiten en maken deze activiteiten onderdeel uit van de standaard ingest procedure?
  • Is uw organisatie van plan om een ingest proces in te richten waarbij de bestandsformaten van de te preserveren objecten worden geïdentificeerd en eventueel gecontroleerd en gerapporteerd?
  • Is uw organisatie van plan om voorafgaand aan de ingest in het digitaal archief het digitaal materiaal op virussen te controleren ?
Competenties Ontbreekt
Casus B&G Onderdelen van de ingestworkflow bij Beeld en Geluid bestaan uit: een fixitycheck op basis van de aangeleverde checksum of een head-and-footercheck, formaatbepaling, extractie technische metadata, kwaliteits- en volledigheidscontrole essence (AV-content) en metadata en toewijzing identifier. De normatieve onderdelen van de de ingestworkflow staan gedocumenteerd in het Informatiemodel van Beeld en Geluid. Dit model is gebruikt al referentie bij implementatie van de workflows in het MAM-systeem.

Bron : Informatiemodel Beeld en Geluid ; Digitale Preservering bij Beeld en Geluid (H.6)

Casus NA Bij de ingest van de SIP wordt een aantal controles en identificaties uitgevoerd die randvoorwaardelijk zijn voor goed beheer en beschikbaarstelling van digitale informatie:

a. Karakterisatie is een verzamelterm voor de volgende handelingen:

  1. Identificatie: het bestandsformaat wordt geïdentificeerd en middels een in de metadata opgeslagen unieke verwijzer aan de Technical Registry gekoppeld.
  2. Validatie: gekeken wordt of het bestandsformaat volgens de technische specificaties is opgebouwd.
  3. "Meten" van technische eigenschappen die eventueel duurzaam beheer in de weg kunnen staan (denk aan encryptie, compressie) Ook dit wordt middels een PUID opgeslagen in de metadata.
  4. Identificeren van embedded objecten (bijv. afbeeldingen of grafieken in een Wordbestand) of objecten in containerbestanden (e-mail met bijlagen, webpagina's van een website): bestandsformaten van deze objecten worden middels een PUID opgeslagen in de metadata.
  5. 5.Identificeren van bestandseigenschappen. De waarden van deze properties worden geëxtraheerd en samen met een verwijzing naar de eigenschap middels een PUID opgeslagen. Denk aan hoogte en breedte van een afbeelding, aantal pagina's/woorden van een tekstdocument etc.

b.Controles

Daarnaast is sprake van een aantal kwaliteitscontroles met betrekking tot de integriteit zoals hier genoemd:

  1. Metadata Integrity check: er wordt nagegaan of alle content files zijn gespecificeerd in de metadata middels de correcte (relatieve) locatie;
  2. Content Integrity check: er wordt nagegaan of de content files zijn gespecificeerd in de metadata xml en dat dit consistent gebeurt.

Door bovenstaande controles uit te voeren zorg je ervoor dat er geen content wordt opgenomen zonder metadata en er geen metadata wordt opgenomen zonder content.

Een ander integriteitscontrole is de Fixity Check. De checksum voor elke content file wordt vergeleken met de originele checksum gespecificeerd in de metadata. Deze controle vindt na ingest periodiek plaats. Voor de ingest kan hij na elk transport (ftp, kopiëren, etc) ook worden gecontroleerd.

En natuurlijk vindt de viruscontrole plaats en is de beveiliging geregeld conform de eisen van de Baseline Informatiebeveiliging Rijksdienst (BIR).

Bron: NA Preservation policy

URL: http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal