Vorlesung 8 (17.12.21): Suchmaschinen und Discovery-Systeme

In der Vorlesung 8 behandelten wir das Thema Suchmaschinen und Discovery-Systeme. Zudem importierten wir im Praxisteil all unsere Datensätze aus Koha, ArchivesSpace, DSpace und DOAJ in VuFind.

Wichtige Begriffe

Discovery-System

Discovery Systeme ermöglichen es, die verteilten Ressourcen einer Bibliothek (eigene und lizenzierte) an einer Stelle zusammenzuführen, in einem umfassenden zentralen Suchmaschinenindex zu erschließen und für den Nutzer zu gleichen Bedingungen recherchierbar zu machen (Böhner & Knoll, o.J.). Das führende Open-Source Discovery-System im Bibliotheksbereich ist Vufind.

Solr

Solr besteht seit 2006 (Apache Solr, 2006) und ist neben ElasticSearch eine der beiden grossen Volltextsuchmaschinen, die hinter fast jeder Internetseite stehen (Heise online, 2013). Solr ist eine Open Source Software und auch die Suchmaschine hinter der Software VuFind.

VuFind

VuFind ist die Weboberfläche um Solr herum, das Tool, das die Nutzungsoberfläche zum Suchindex bereitstellt und somit die Interaktion zwischen dem Nutzenden und dem Suchindex abhandelt. VuFind ist mit Exlibris Primo vergleichbar, ein Discovery-System, welches ebenfalls auf Solr basiert.

VuFind

Sehr spannend an der heutigen Vorlesung fand ich die Beispiele aus der Praxis, also wie das Discovery-System VuFind von verschiedenen Institutionen verwendet wird. Die verschiedenen Arten der Gestaltung und zu sehen, wie Vufind erweitert werden kann und individualisierbar ist, hat mich erstaunt. Besonders, weil ich in der letzten Aufgabe selbst kleinere Anpassungen in der Gestaltung vorgenommen hatte. Eine Frage, welche ich mir während der Aufgabe gestellt hatte, nämlich was genau Solr ist konnte ich in der Vorlesung ebenfalls klären. Besonders hilfreich fand ich dabei den Einblick in die Administrationsoberfläche und die Erklärung, wie VuFind und Solr zusammenhängen und zusammenarbeiten. Zudem fand ich es verblüffend, dass Solr so verbreitet ist und sogar hinter Netflix und ebay steht (Lucidworks, 2012). Zum Zusammenspiel von Solr und VuFind haben wir eine kurze Übung gemacht, in der wir Suchresultate von Solr (in der integrierten Suchoberfläche) mit denjenigen in Vufind verglichen haben. Zusammengefasst konnte ich durch die Übung sehen, welchen Mehrwert VuFind gegenüber Solr liefert. Solr hat die Suchresultate zum Begriff “Psychology” ungeordnet ausgegeben. VuFind hingegen hat die Ergebnisse bei Solr abgefragt und aufgewertet, in dem es mithilfe von Relevance Ranking (welches ich in der Aufgabe zur Vorlesung 7 festgelegt habe) versucht hat, eine sinnvolle Reihenfolge und somit ein gutes Suchergebnis auszugeben.

Übung zur Datenintegration

Ziel der Übung zur Datenintegration war es, alle konvertierten Daten aus Koha, ArchivesSpace und DSpace, sowie die Beispieldaten aus dem Directory of Open Acess Journals (DOAJ) in VuFind zu importieren. Es sollte also ein übergreifender Katalog mit Daten aus verschiedenen Quellen entstehen. Beim Importieren der Daten aus Koha ist mir bei der Kontrolle aufgefallen, dass nur einer von zwei Datensätzen übernommen wurde. Der Fehler lag im Feld 001 des ersten Datensatzes, denn die eindeutige Identifikationsnummer fehlte. Nach Ergänzung dieser Nummer konnte auch dieser Koha-Datensatz importiert werden. Die Daten aus dem DOAJ liessen sich problemlos importieren. Die Daten aus ArchivesSpace und DSpace konnte ich vorerst nicht importieren.

Zwischenfazit

Nun haben wir also auch den letzten Teil des Schaubildes kennengelernt, die Zusammenführung der Daten im Suchindex von VuFind. Somit habe ich alle Bestandteile des Schaubildes kennengelernt und weiss, wofür die jeweiligen Begriffe stehen. (Quelle: Gemeinsames Dokument Tag 1, BAIN)

Zusammenfassend haben wir das Bibliothekssystem Koha und das Archivsystem ArchivesSpace kennengelernt und installiert. Zusätzlich haben wir uns mit der Repository-Software DSpace befasst und mit dessen Demoversion gearbeitet. Von diesen Systemen haben wir über die OAI-PMH-Schnittstelle mittels dem Programm VuFindHarvest Daten heruntergeladen (bei DSpace nur herauskopiert, da die Daten wieder gelöscht wurden). Die gespeicherten Daten haben wir mittels marcEdit (XSLT) in MARC21-XML konvertiert. Die Daten von Koha lagen schon in diesem Format vor. Zusätzlich haben wir uns mit Daten im Tabellenformat aus dem Directory of Open Acess Journals befasst, diese mit OpenRefine bearbeitet und über den templating exporter von OpenRefine manuell in MARC21-XML umgeschrieben. Heute haben wir alle Datensätze mithilfe eines Importskripts in Solr geladen. In VuFind, einem Discovery-System kann man diese nun abrufen.

Quellen:

Apache Solr. (2022). Apace Solr project information.Abgerufen am 03.01.2022 unter: https://solr.apache.org/whoweare.html
Böhner, D. & Knoll, A. (o.J.). Discovery Systeme – Fluch oder Segen für Bibliotheken. Abgerufen am 03.01.2022 unter: https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/1505
Heise online (2013). Volltextsuche mit ElasticSearch. Abgerufen am 03.01.2022 unter: https://www.heise.de/hintergrund/Volltextsuche-mit-ElasticSearch-1920454.html
Lucidworks (2012). Companies Using Lucene/Solr. Abgerufen am 03.01.2022 unter: https://lucidworks.com/post/who-uses-lucenesolr/