Zu Beginn der sechsten Vorlesung beschäftigten wir uns mit den verschiedenen Austauschprotokollen für Metadaten. Anschliessend lernten wir VuFindHarvest, einen OAI-Harvester kennen. Zum Schluss ging es um die Konvertierung von Metadatenstandards (XSLT Crosswalks mit MarcEdit).


Wichtige Begriffe

VuFindHarvest

VuFindHarvest ist ein OAI-Harvester, sammelt also die Daten von der OAI-PMH-Schnittstelle.

Crosswalks

Beschreibt die Konvertierung von einem Metadatenstandard in einen anderen. Crosswalks beinhalen Regeln, wie Elemente und Werte zugeordnet werden (Mapping).

XLST

XLST ist die Programmiersprache zur Transformation von XML-Dokumenten.

MarcEdit 7

MarcEdit wurde 1999 enwickelt und umfasst viele Funktionen (Quellen: Wikipedia, Library Carpentry). Wir benutzen MarcEdit zur Konvertierung von Metadaten.


Austauschprotokolle für Metadaten

Es bestehen drei weit verbreitete Übertragungsprotokolle im Bibliotheks- und Archivbereich:

  • Z39.50 (Library of Congress)
  • SRU - Search/Retrieve via URL (Library of Congress)
  • OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting (Open Archives Initiative)

Diese Protokolle haben wir in den vergangenen Vorlesungen schon kennengelernt und auch damit gearbeitet. Worin die Unterschiede zwischen den Protokollen bestehen, habe ich bisher jedoch nicht ganz verstanden. Daher war ich froh, dass die Protokolle in der Vorlesung nochmals aufgegriffen wurden. Ein grosser Unterschied besteht darin, dass Z39.50 und SRU sich für Live-Abfragen oder gezielten Datenabruf mit vielen Parametern eignen. Bei OAI-PMH geht es um grössere Datenabzüge und regelmässige Aktualisierungen.

Metadaten über OAI-PMH harvesten mit VuFindHarvest

Im zweiten Teil der Vorlesung ging es nun darum, die über die OAI-PMH angebotenen Daten (von Koha und ArchivesSpace, siehe Abbildung) mit dem Tool VuFindHarvest zu ernten (harvesten). Dazu überprüften wir zuerst die OAI-Endpoints von Koha und ArchivesSpace.

image (ArchivesSpace)

image (Koha)

Danach installierten wir VuFindHarvest, um die Daten aus Koha und ArchivesSpace damit zu laden (Format marcxml/oai_ead). Wir arbeiteten dazu mit verschiedensten Befehlen im Terminal. Schlussendlich lagen die exportierten Metadaten in 2 Ordnern vor.

XSLT Crosswalks mit MarcEdit

Nun ging es darum die Daten aus einem Metadatenformat in ein anderes Metadatenformet zu bringen. Ziel war es, dass die Daten aller 3 Systeme schlussendlich im Format MARC21-XML vorliegen (bei Koha war das bereits der Fall). Dazu nutzten wir MarcEdit 7, eine Software, die wiederum installiert und konfiguriert werden musste. Die Konvertierung der Daten aus DSpace und ArchivesSpace hat funktioniert, jedoch hat man deutlich gesehen, dass diese bei EAD zu MARC21 nicht verlustfrei ablief. Das liegt auch daran, dass MARC21 und EAD für unterschiedliche Anwendungskontexte entwickelt wurden. Bibliotheksdaten sind medienzentriert, bei EAD steht der Entstehungszusammenhang im Fokus. Durch Mapping wird vorgegeben, wie die Felder und deren Inhalte vom einen Metadatenstandard in die Felder des Zielstandards übertragen werden sollen (Prozess = Crosswalk). Den Vorgang und die Überlegungen zu Mappings fand ich sehr spannend!

Zwischenfazit

image Wir haben nun 3 Systeme kennengelernt und Datensätze darin erstellt. Die Daten haben wir mit VuFindHarvest von der OAI-PMH-Schnittstelle geharvestet (Koha/ArchivesSpace). Zu guter letzt haben wir die Daten von DSpace und ArchivesSpace mithilfe von MarcEdit in MARC21-XML konvertiert.