Zusammenhänge finden
Mittels Repositorium, Annotations- und Vokabulardienst können Texte und Bilder mit kontrollierten Begrifflichkeiten erschlossen werden. Zweck dieser Arbeit ist in der Regel eine bestimmte Auswertung, um eine gegebene Forschungsfrage besser und fundierter beantworten zu können.
Wie lassen sich nun Annotationen auswerten und präsentieren?
Die Datenanalyse kann je nach Forschungsfrage, Daten und Metadaten sehr unterschiedlich aussehen. Oftmals werden darunter statistische Verfahren verstanden. Im Folgenden soll aber davon ausgegangen werden, dass auch schon das Auffinden oder Gewinnen bestimmter Informationen (information retrieval) für die Analyse von Daten im Hinblick auf die Beantwortung einer Forschungsfrage vonnutzen sein kann. Statistische Auswertungen können sich daran anschließen. Auf zwei Beispiele soll an dieser Stelle noch einmal zurückgekommen werden, um beide Analysemöglichkeiten zu veranschaulichen. Sie stammen aus verschiedenen Teilprojekten des Sonderforschungsbereichs Episteme in Bewegung.
Informationsgewinnung
In dem ersten Anwendungsbeispiel wurden Paratexte zu de interpretatione untersucht. In der umfangreichen Überlieferung zu dieser logischen Schrift des Aristoteles konnten so Verknüpfungen zwischen einzelnen Handschriften nachgewiesen werden. Diese Handschriften wiesen zum Teil weniger signifikante Gemeinsamkeiten im überlieferten aristotelischen Text selbst auf als vielmehr in der Glossierung und in den Diagrammen.
Die Auswertung der Daten und Metadaten zu diesem Beispiel erfolgte mithilfe sogenannter SPARQL-Abfragen. SPARQL (SPARQL Protocol And RDF Query Language) ist eine Sprache, die es erlaubt, digitale Daten im RDF-Format (Resource Description Framework) zu durchsuchen. Die Annotationen, die erstellt wurden, folgen dem Web Annotation Data Model. Daten, die diesem Modell folgen, lassen sich im RDF-Format ausgeben und entsprechend mittels SPARQL durchsuchen. Für solche Abfragen existieren bereits verschiedene Dienste. Im gegebenen Fall wurde auf den SPARQL Query Service zurückgegriffen. Als ein weiterer generischer Dienst steht YASGUI zur Verfügung.
Zugänglichkeit
Im Fall der Handschriften von de interpretatione zeigt sich noch ein besonderes Hindernis. Der Zusammenführung von Handschriftendigitalisaten stehen oftmals die verschiedenen Nutzungsbedingungen der zahlreichen Bibliotheken und Archive im Wege, welche im Besitz der Handschriften sind. Zum Teil sind hohe Kosten mit der Nutzung verbunden. Für die Auswertung bedeutet dies, dass die Bilder, auf die die Annotationen verweisen, unter Umständen nicht allgemein zugänglich gemacht werden können. Verschiedene Lösungen für diese Problem bestehen in diesem Fall:
- Das Berliner Aristotelesarchiv verfügt über viele, gleichwohl ältere Mikrofilmaufnahmen. Deren Digitalisate können von Nutzenden des Archivs eingesehen werden.
- Die Texte des Aristoteles verfügen über eine kanonische Zählung. Auch wenn man nicht allen den Abschnitt auf der Seite zeigen kann, auf den sich zum Beispiel eine Glosse bezieht, so kann man die Zählung sowie den Text einer zugänglichen wissenschaftlichen Edition angeben, der an dieser Stelle glossiert wird. Da das Annotationswerkzeug des Sonderforschungsbereichs zugleich auf Texte und Bilder verweisen kann, wird ein solches Vorgehen erleichtert.
- Für bestimmte Fragestellungen genügt schließlich unter Umständen schon der Inhalt der Annotationen. Diese Annotationen bieten unter anderem Transkriptionen und Übersetzungen der Glossen, die für viele Forschungsfragen relevant und bereits hinreichend sein können. Für diese gilt die Einschränkung der Nutzungsbedingungen nicht, sodass sie für weitere Untersuchungen zur Verfügung stehen.
Statistische Datenauswertung
In dem zweiten Anwendungsbeispiel werden die Vorworte zu frühneuzeitlichen Sprachlehrwerken untersucht. Hier werden auf derselben technischen Grundlage Annotationen erstellt, ein Vokabular angelegt und Analysen vorgenommen. Das Vokabular dient in diesem Fall für die einheitliche Bezeichnung sozialer Gruppen, die in den Lehrwerken direkt oder indirekt angesprochen werden. In den Quellen selbst wird in verschiedenen Sprachen geschrieben. Auch innerhalb einer Sprache werden verschiedene Ausdrücke für dieselbe oder nahezu dieselbe Gruppe verwendet. Die Vereinheitlichung der Bezeichnungen mit einem kontrollierten Vokabular ist deshalb ein notwendiger Schritt auf dem Weg zur Datenanalyse.
Literatur
Krewet, Michael u.a.: „Die Aktualität des Unzeitgemäßen“, in: Kulturen des digitalen Gedächtnisses, hg. von Michaela Geierhos, Potsdam 2022, S. 75–78.
Schlagwörter
- Aristoteles
- Datenanalyse
- De Interpretatione
- Fremdsprachenlehrwerke
- Information Retrieval
- SPARQL
- Statistik