My BAIN Blog [Bibliotheks- und Archivinformatik]

Ein Lerntagebuch für den Kurs Bibliotheks- und Archivinformatik HS2020, übernommen von Dozent Lohmeier

Follow me on GitHub

Bitte keine Scherereien

Neuer Tag, neuer Unterricht, hoffentlich klappt es.

Was im Unterricht geschieht

Wir erfahren:

  • OAI-PMH Schnittstellen sind dazu da, um die Daten nach draussen bereit zu stellen. Andere Bibliotheken können damit Verbundrecherchen und Rechercheportale herstellen.
  • Der Herausgeber von FOLIO ist die Open Library Foundation. Der Vorteil von solchen Open Source Projekten ist, dass die Quellcodes bereit stehen und kein Buyer-Lock In stattfindet.
  • FOLIO war zum Zeitpunkt, als die Kriterien von der Swiss Library Service Plattform (SLSP) erstellt wurde, noch nicht konkurrenzfähig zum System ALMA.
  • Die Unterschiede bei der Software von öffentlichen und wissenschaftlichen Bibliotheken ist, dass die Software unterschiedlich ausgeprägt sind. Die öffentlichen Bibliotheken haben meist dazu noch Veranstaltungsmanagement und ein schöneres Interface. Richtige harte Unterschiede gibt es aber nicht wirklich. Und die Unterschiede verschwimmen auch gemäss unserem Dozenten.

Dann haben wir uns die Online-Archivkataloge des Staatsarchiv Basel-Stadt und der ETH Zürich angeschaut, um zu sehen, was diese für eine Struktur haben. Nach der Besprechung ging es weiter mit der Open Source-Archivsoftware Archive Space.

Anschliessende Übung mit Archive Space

Die Installation von Archivespace hat gut funktioniert, ich musste nichts nach-installieren und herumsuchen. So lobe ich mir das Ganze. Ich bin nämlich nicht so versiert in IT-Sachen. Bei der Übung haben wir dann Daten von einem anderen Archiv ins Archivspace versucht zu übertragen und gerätselt, was wo am besten hineinkommt. Im Grossen und Ganzen eine praktische Erfahrung.

Archivformate

Das International Standard Archival Description (General) oder kurz, ISAD(G), ist verschieden von medienzentrierten Standards. Bei ISAD(G) hat man noch die analoge Methoden zur Suche (Findmittel) versucht, ins digitale zu übertragen. Dabei ist hier die Provenienz wichtig. Es wird weniger das Medium beschrieben, sondern wer das Werk erstellt hat, von welchen anderen Archiven das Material stammt usw. Sprich, es geht darum, den Entstehungszusammenhang nachvollziehen zu können. Das Gegenteil hiervon ist die Pertinenz, wo Aktenunterlagen zusammengelegt werden je nach gemeinsamen Eigenschaften wie Territorial-, Personal- oder Sachbetreffen.
Bei anderen Bibliotheksstandards spielt es keine Rolle, von welchem Buchhändler das Werk erworben wurde. Archivbestände sind sehr unikal, und Bibliotheksbestände sind häufig.

  • Ein Defizit von ISAD(G) ist, dass es nicht maschinell verwertbar ist. Vielleicht könnte da aber Linked Data helfen.
  • Wie der Bestandsbildner den Fokus gelegt hat, ist auch nicht unbedingt klar.
  • ISAAR(CPF) ist zu aufwendig, um wirklich angewendet zu werden.
  • Die Archive haben die Digitalisierung anfänglich stark vernachlässigt. Das ist aber zu einem gewissen Grad ein Glücksfall gewesen, weil sie nun Bibliotheksstandards wie die GND (Globale Normdateien) übernehmen.

Encoded Archival Description (EAD) ist ein XML-Standard, von welches verschiedene Versionen existieren.

Ein neuer Standard

Records in Context (RIC) wird dann mittels dem Linked Data-Prinzip das ISAD(G) zu einem gewissen Grad ersetzen. Während man mit den vorherigen Archiv-Standards sich noch Schicht für Schicht durchgearbeitet hat, wird man hier alles mehrfach verknüpfen können. Das RIC wird von der Experts Group on Archival Description (EGAD) ausgearbeitet.

Optical Character Recognition

Mit den neuen Möglichkeiten der Digitalisierung wird man jetzt auch handschriftliche Dokumente für die Volltextsuche optimieren können (oder es zumindest versuchen) und dann die entsprechenden Unterlagen mittels Named Entity Recognition zuordnen. Wobei wir wiederum im Fach Digitalisieren gelernt haben, dass das OCR schon noch seine Mühe hat, und durchaus fehlerhafte Resultate erzielen kann bei der Text-Erkennung. Vielleicht wird man da weiterhin Leute benützen müssen, die die Texte direkt in den Computer eingeben, anstatt dass man die Dokumente scannt und darauf hofft, dass die Software ausgereift genug programmiert wurde, um es so gut wie möglich zu lesen. Und selbst richtige Menschen bekunden ja schon Schwierigkeiten damit, das komische Gekritzel von anderen Leuten interpretieren zu müssen.

EGAD!!!

So wie der Herr Linus Torvalden mit Git auf selbsthumoristische Weise sich selbst als Doof bezeichnet hat, wundere ich mich jetzt, ob die Herren und Damen von der EGAD sich nicht absichtlich diese Kürzelbezeichnung gegeben haben. Wenn man nämlich auf Google Egad sucht, kriegt man nämlich eher folgendes Resultat.

Ach du meine Güte

Abbildung 1: Alte Archivknackis, die wieder einen neuen Standard hervorkramen wollen

Archive Space

Archive Space ist non-profit (und open source), und konkurrentiert mit privatwirtschaftlichen Dienstleistungen. Nichtprofitorientiert bedeutet jedoch nicht kostenlos. Für die Anwendung muss man eine Gebühr zahlen. Damit will die Community hierfür garantieren, dass es immer engagierte Vollzeit-Programmierer’innen geben kann, die den Support für diese Software aufrecht erhalten.

KOHA und Archivespace scheinen gut miteinander zu funktionieren, was nicht eine Selbstverständlichkeit darstellt. Normalerweise wird eher empfohlen, dass man nicht zwei solche Systeme auf einem Server hat, weil das zu Probleme mit Abhängigkeiten voneinander führen kann. Und das ist definitiv nicht gut.

Was beinhaltet Archive Space alles?

In diesem Video wird erklärt, was es alles kann.

Fazit zu diesem Zeitpunkt

Was ich eher negativ halte, ist dass man scheinbar für Archive Space man immer die Shell aktiviert lassen muss. Das stelle ich mir als nicht so praktikabel vor für den Gebrauchsalltag.