Approval.

This commit is contained in:
2023-10-06 20:48:03 +00:00
committed by md translation bot
parent dde939a533
commit f407586143
5 changed files with 55 additions and 0 deletions

View File

@ -59,4 +59,15 @@ Gibt es allerdings ein konsistentes Ausgabeformat, das hier noch nicht berücksi
'outlook_text' => 'museum-digital:qa bietet eine Plattform, um Museumsdaten aus verschiedensten Quellen einfach ansprechen und weiterverarbeiten zu können - spezifisch, um sie Tests zur Überprüfung der Datenqualität zu unterziehen. Durch die strikte Trennung der Komponenten - dem Auslesen der Daten einerseits, den Checks andererseits und schließlich der Kommunkation zwischen den eben genannten - ist es leicht um weitere Tools erweiterbar.
Mit einer OpenAPI-Definition für die Programmierschnittstelle können die durch museum-digital:qa verfügbar gemachten Tools einfach durch Softwareanbieter und Forschende nachgenutzt werden.',
'tech_background_text' => 'museum-digital:qa nimmt Daten aus gängigen und konsistent vorliegenden Eingabeformaten entgegen, bringt diese in ein internes, einheitliches Format, um diese schließlich hinsichtlich ihrer Vollständigkeit und Plausibilität auszuwerten. Eingabeformate können einerseits die Ausgabe- und Exportformate von verschiedenen Sammlungsmanagementsystemen, so diese für alle das Programm nutzenden Museen gleich geformt sind, oder die gängigen Austauschformate für Objektdaten sein.
Die üblichen Sammlungsmanagementsysteme haben verschiedene Ansätze, um mit spezifischen Anpassungen der Datenbank an einzelne Museen umzugehen. Während museum-digital:musdb gezielt keine vom Museum selbst definierten Felder zulässt, um eine konsistente Datenbankgestaltung über Institutionsgrenzen hinweg zu ermöglichen, und so einerseits eine Vielzahl von Auswertungsfunktionen, die auf die Feldauswahl zugeschnitten sind anbieten zu können, und andererseits Export- und Suchfunktionen über mehrere Museen hinweg zu ermöglichen, sind andere Sammlungsmanagementsysteme auch intern deutlich stärker auf die sie nutzenden Museen zugeschnitten. Diese Anpassbarkeit kann entweder auf Ebene der Benutzeroberfläche oder direkt auf der Ebene der Datenbankstruktur vorliegen. Ist auch die Datenbankstruktur anpassbar, heißt das gleichzeitig, dass die Exporte aus derselben Software je nach Museum sehr unterschiedlich geformt sein können. Wo nur die Benutzeroberfläche angepasst wird, gibt es oft softwarespezifische Standard-Exportformate, die über Museumsgrenzen hinweg konsistent geformt, gut gewartet und ggfs. vollständiger als andere Exportoptionen sind (und somit etwa für eine Migration der Daten besonders gut geeignet sind).
Um den Austausch von Daten über Institutions- und Softwaregrenzen hinweg zu vereinfachen, haben sich verschiedene offene (Austausch-)Standards etabliert. Der für Museen sicherlich wichtigste ist dabei LIDO, in angrenzenden Bereichen werden etwa EAD (v.a. Archive) und MODS (v.a. Bibliotheken) verwendet. Diese Standards sind in den meisten Fällen für den Austausch veröffentlichbarer Daten gedacht, decken also in den seltensten Fällen alle lokal vorhandenen Datenfelder ab. Offene Standards sind andererseits in vielen Sammlungsmanagement-Lösungen implementiert. Mit dem 2023 veröffentlichten EODEM sind im Museumsbereich erste Schritte zu erkennen, auch primär interne Daten standardisiert austauschbar zu machen.
Zum Zwecke des Importierens von Daten (sei es zur Migration der Daten für die Inventarisierung oder zur Veröffentlichung) bietet museum-digital ein Import-Tool, das neben den gängigen Austauschformaten auch einige software-spezifische Formate beherrscht (einerseits, weil nicht alle Sammlungsmanagementsysteme die gängigen Austauschformate "von Haus aus" unterstützen, anderseits, weil diese wie oben besprochen oft vollständiger sind). Dieses Import-Tool besteht seinerseits aus drei Komponenten: 1) grundlegenden, für die Museumarbeit relevanten Datentypen (etwa Objekt, Schlagwort, Leihverkehr), 2) Funktionen zum Auslesen von Daten aus den erwähnten Formaten und die Überführung der Eingabedaten in die eben genannten Datentypen, und 3) einem Modul zum tatsächlichen Überführen der Daten in die Datenbank.
Die Importer-Module zur Definition der Datentypen und zum Auslesen der Daten aus verschiedenen Eingabeformaten werden in museum-digital:qa nachgenutzt. So kann museum-digital:qa mit wenigen Anpassungen alle Importformate, die auch der Importer von museum-digital unterstützt, unterstützen (bei museumsspezifischen Importformaten lohnt es sich allerdings nicht, diese Anpassungen zu unternehmen). Ohne relevanten eigenen Code für das Auslesen der eingehenden Daten bleibt museum-digital:qa somit zudem sehr wartungsarm. Umgekehrt bedeutet die Nachnutzung des Auslese-Teils des Importers auch, dass alle Daten, die mit museum-digital:qa auf ihre Qualität überprüft werden können, ohne weitere Anpassungen in museum-digital importiert werden können.
Die eingelesenen Daten liegen in der Folge in einer strukturierten Form vor und können verhältnismäßig einfach weiter verarbeitet werden, indem sie - leicht umformuliert - an die Funktionen zur Überprüfung der Datenqualität weitergegeben werden. Diese Funktionen wurden im Zuge der Arbeit an museum-digital:qa aus museum-digital:musdb in eine eigene Open-Source-Bibliothek ausgelagert.',
);