Methoden, Verfahren und Werkzeuge zur Erstellung digitaler Editionen

Konzeption und Entwicklung ergonomischer Softwarelösungen zur Abbildung des Arbeitsablaufes in editionswissenschaftlichen Forschungsvorhaben

Von Thomas BurchRSS-Newsfeed neuer Artikel von Thomas Burch

Einleitung*

Die Erforschung und Erschließung historischer Quellen ist heute ohne adäquate informationstechnologische Unterstützung kaum mehr denkbar. Digitale Ressourcen, Methoden und Verfahren gewinnen gerade in den geisteswissenschaftlichen Disziplinen zunehmend an Bedeutung. Die entwickelten Software-Lösungen für die Philologien werden allerdings nur dann akzeptiert, wenn sie entscheidende Charakteristika der spezifischen Arbeitsabläufe philologischer Forschung berücksichtigen. So werden kritische Werkausgaben in der Editionsphilologie in der Regel kollaborativ in aufwändiger, mitunter jahrzehntelanger Arbeit erstellt und gelten als Referenztexte für mehrere Wissenschaftlergenerationen. Der daraus resultierende Anspruch, langfristig gültige Forschungsergebnisse zu publizieren, hat zur Folge, dass kritische Apparate und philologische Studien vor der Publikation mehrfach redigiert werden und Primärtexte für Editionen verschiedene Kollationsstufen durchlaufen, nach denen immer wieder Korrekturen in die Dokumente eingearbeitet werden, bis philologisch gesicherte Textfassungen hergestellt worden sind.

Wird dieser Arbeitsablauf von Anfang an durch digitale Infrastrukturen in Form von Datenbanken, Algorithmen, Visualisierungsmethoden und strukturierten Datenkodierungen begleitet, spricht man von einer sogenannten „born digital“ erstellten digitalen Edition. Während im Falle von Retrodigitalisierungen in der Regel Wert darauf gelegt wird, das Layout und Referenzsystem der Buchausgabe aus Gründen der Zitierfähigkeit in der elektronischen Fassung zu reproduzieren, kann bei genuin digitalen Editionen der Bezug zwischen editorischem Inhalt und der angestrebten Publikationsform von vornherein berücksichtigt werden. Dies bedeutet allerdings nicht, dass Aufbau und Form einer solchen Ausgabe in gleicher Weise normiert wären, wie dies für gedruckte Ausgaben gilt: Während diese medientechnisch im Grunde seit dem späten 19. Jahrhundert ausgereizt sind und in den letzten Jahren lediglich durch verbesserte Druckverfahren neue Impulse erhielten, ist das Potential digitaler Editionsformen aus heutiger Sicht noch nicht absehbar. Entsprechende Ausgaben orientieren sich daher häufig noch immer an bestehenden Konzepten, deren jeweilige Eignung für das digitale Medium kritisch zu hinterfragen ist. Gleichzeitig werden neue Wege beschritten, wo immer sie Vorteile für die Nachvollziehbarkeit und Benutzbarkeit der Ausgabe versprechen. Dies betrifft beispielsweise die enge Bindung zwischen transkribiertem Text und Faksimile, die eine unmittelbare Zuordnung editorischer Kommentare zum Original ermöglichen und damit den Umgang mit der Ausgabe insgesamt deutlich erleichtern.[1]

Durch die Abstraktion von einem anhand der vorgegebenen Editionsrichtlinien eindeutig festgelegten Text liegt eine wesentliche Stärke von „born digital“-Ausgaben in der Möglichkeit dynamischer Darstellungsformen. Anders als in einer gedruckten Buchausgabe mit ihren platzbedingten Vorgaben, können in der digitalen Edition mehrere alternative Darstellungen eingesetzt werden, um einen editorischen Sachverhalt anschaulich darzustellen. Erst durch eine derart variable Anzeige von Originalen, Primärtexten, philologischen Kommentaren sowie Sekundärquellen, die sich unterschiedlichen Textstufen, Varianten oder intertextuellen Zusammenhängen anpassen kann, werden die Entstehung eines Werkes und seine Interpretationsmöglichkeiten offensichtlich.

Diese rein digitale Erstellung und Bearbeitung der Editionsinhalte hat für den Editionswissenschaftler grundsätzlich Änderungen und Anpassungen seiner traditionellen Arbeitsweise zur Folge. Durch Software-Systeme lassen sich zwar mechanische Arbeitsschritte, etwa bei der Kollationierung von Textstufen, erleichtern und beschleunigen. Vorab erfordert dies aber eine formale Auseinandersetzung mit den der Edition zugrundeliegenden Codierungen, die sicherlich ein verändertes Profil der editorischen Arbeit erzwingt. Dabei ist ein Festhalten an den bisherigen Qualifikationen eines Editors unerlässlich, will man nicht die wissenschaftliche Qualität einer Ausgabe aufs Spiel setzen. Digitale Editionen sind damit in besonderem Maße auf eine interdisziplinäre Zusammenarbeit zwischen Geisteswissenschaften und Informatik angewiesen.[2]

Die Unterstützung eines derartigen Editionsvorhabens stellt damit genauso Herausforderungen an die beteiligten Informatiker, insbesondere dann, wenn generische Lösungen angestrebt werden. Eines der wichtigsten Ziele stellt hier zweifelsohne die Bildung von Infrastrukturen dar. Damit werden nicht nur wissenschaftliche Ergebnisse leicht zugänglich gemacht, sondern es lassen sich auch mit anderen Projekten direkte Verknüpfungen und Vernetzungen herstellen. Anders gewendet könnte man auch sagen, dass, will man ein digitales Editionsprojekt zukunftsfähig machen, die Möglichkeit der Nachnutzung sowohl der eingesetzten Werkzeuge als auch der erstellten Daten unbedingt gewährleistet sein muss. Den Leitfaden bildet hier der Anspruch, den editionswissenschaftlichen Arbeitsablauf möglichst ergonomisch in ein Software-System abzubilden. Dazu gehört vor allem die Entwicklung geeigneter Werkzeuge und Algorithmen, die Unterstützung der Teamarbeit in räumlich verteilten Arbeitsstellen, der Entwurf intuitiver Visualisierungsmethoden sowie der Konzeption geeigneter, auf internationalen Standards basierender Kodierungsschemata, um eine langfristige Nachnutzbarkeit der Forschungsergebnisse zu gewährleisten.

Abb. 1: Arbeitsablauf auf der Basis einer virtuellen Forschungsumgebung

Virtuelle Forschungsumgebung

In den Geisteswissenschaften gewinnen ebenso wie in anderen Wissenschaftsbereichen kooperative und koordinierte Formen der Forschungsarbeit zunehmend an Relevanz. Forschergruppen, die zum Teil an unterschiedlichen Orten angesiedelt sind, arbeiten gemeinsam an einem Thema. Eine systematische und strukturierte Organisation des wissenschaftlichen Arbeitsprozesses stellt daher eine wesentliche Voraussetzung für die effiziente und erfolgreiche Projektdurchführung dar. Zu den zentralen Aufgaben im Bereich der Schaffung moderner Informationsinfrastrukturen gehören deshalb die Entwicklung und Implementierung von virtuellen Forschungsumgebungen (VFUs), die den wissenschaftlichen Arbeitsprozess in seinen verschiedenen Phasen unterstützen (vgl. Abb. 1) sowie die orts- und zeitunabhängige Zusammenarbeit ermöglichen.

Dieses Anforderungsprofil für eine VFU[3] erfüllt das Forschungsnetzwerk und Datenbanksystem (FuD)[4], das seit 2004 gemeinsam von dem Sonderforschungsbereich 600 „Fremdheit und Armut“, dem Forschungszentrum Europa und dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren an der Universität Trier entwickelt wird. Die integrierte Arbeits-, Publikations- und Archivplattform wurde bereits 2006 erfolgreich in den Teilprojekten des SFB eingeführt und zählt damit zu den ersten Softwarelösungen dieser Art in den Geisteswissenschaften überhaupt.[5] Inzwischen wird die Forschungsumgebung von verschiedenen Projekten an Universitäten, Akademien und Instituten eingesetzt. Das breite Spektrum der Forschungsanwendungen reicht von der Sammlung und Erschließung von Primärdaten unterschiedlichen Typs über die Erstellung von Quellen- und Regesteneditionen und weiteren Fachpublikationen bis hin zur Vorbereitung digitaler Werkausgaben sowie zum Aufbau von Nachlassarchiven und Personendatenbanken.[6] Im Folgenden werden anhand von konkreten Forschungsvorhaben einige der Werkzeuge für die unterschiedlichen Arbeitsschritte eines Editionsvorhabens vorgestellt, wie sie gemeinsam vomn Kompetenzzentrum und den beteiligten Wissenschaftlern entwickelt werden.

Metadaten Erfassung

In der Regel beginnen Editionsvorhaben mit der Vorbereitung und Zusammenstellung des Forschungsgegenstandes. Im entsprechenden Arbeitsbereich „Inventarisierung“ der virtuellen Forschungsumgebung können Forschungsdaten unterschiedlicher Gattung über standardisierte Eingabemasken erfasst und mit einem projektübergreifenden Schlagwortregister erschlossen werden. Das Datenbanksystem unterstützt die Aufnahme von Textquellen, wie Briefen, Urkunden, Verwaltungsschriftgut, Zeitungsartikeln oder Responsen, visuellen Medien, wie Bildwerke, Photographien, Lichtbilderprojektionen, archäologische Objekte sowie Tondokumente.

Im Falle der „Digitalen Edition der Korrespondenz August Wilhelm Schlegels“,die derzeit an der Universität Marburg und der Sächsischen Landesbibliothek–Staats-und Universitätsbibliothek Dresden (SLUB) erarbeitet wird,[7] werden hier die Daten aller Handschriften und Briefdrucke in der FuD-Datenbank als Grundlage für die Edition zusammengeführt. Dabei werden Autographen und Drucke synchronisiert und die Verzeichnung der Einzelbriefe wie folgt standardisiert: Schreiber, Datum, Ort des Schreibers, Adressat, Ort des Adressaten, Überlieferungsstatus: Handschrift(en): Ausfertigung, Entwurf, Abschrift, Druck(e), Handschrift(en): Standort; Signatur; Beschreibung (Blatt-/Seitenzahl; Format; Papier; ggf. Besonderheiten: Siegel, Stempel, Beschädigung, Beschriftung durch den Adressaten; Beschriftung durch Dritte), Druck(e): Bibliographische Angabe mit Seitenzahlen; Vermerk zur Vollständigkeit und Zuverlässigkeit des Druckes, ggf. zur Kommentierung (vgl. Abb. 2).

Abb. 2: Metadatenformular zur Inventarisierung der Korrespondenzen August Wilhelm Schlegels (hier das Datenschema zur Erfassung der Erstdrucke)

Die in der ersten Phase des Projektes ermittelten Autographenbestände außerhalb der Sächsischen Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB) werden in Absprache mit den etwa 80 Einrichtungen (insbesondere Archiven und Bibliotheken) in deren digitalen Präsentationen veröffentlicht und via OAI[8]-Schnittstellen zugänglich gemacht. Für diejenigen Bestände, wo dies nicht realisierbar ist, werden sie nach Möglichkeit in den Digitalen Sammlungen der SLUB mit Besitznachweis und Link zur jeweils besitzenden Institution präsentiert. Mit diesem System werden im beantragten Projekt zwei Wege der Datenübernahme unterstützt: Für die bereits vorliegenden Autographen und gedruckten Briefe, die in den Digitalen Sammlungen der beteiligten Institutionen nach internationalen Standards (METS/EAD bzw. METS/MODS) katalogisiert sind, wird eine Schnittstelle in FuD implementiert, die eine konsistente Datenhaltung zwischen den Katalogen und der virtuellen Forschungsumgebung gewährleistet. Noch nicht über Kataloge verfügbare Daten zu digitalisierender Briefe werden zunächst in FuD aufgenommen und auf Metaebene erschlossen. Hier wird ein Exportfilter entwickelt, so dass die Daten aus FuD in den Verbundkatalog Kalliope und von dort wieder in die lokalen Kataloge exportiert werden können. Die Datenbeschreibungen in beiden Systemen werden auf diese Weise jederzeit konsistent aufeinander abgebildet.

Transkription

Auf die Erfassung der Metadaten folgt normalerweise die Anfertigung von Transkriptionen auf der Basis von Originalvorlagen des Editionsgegenstandes. Im Falle einer digitalen Edition kann der Wissenschaftler durch geeignete Werkzeuge unterstützt werden, die eine detaillierte Erfassung von Text- und Korrekturstufen sowie textgenetischen Phänomenen ermöglichen. Ein derartiges Werkzeug namens Transcribo[9] wird in Zusammenarbeit mit dem Projekt „Arthur Schnitzler: Digitale historisch-kritische Edition[10] entwickelt. Neben der Transkription und Auszeichnung handschriftlicher Texte ist jedoch auch ein Einsatz zur Erfassung von Inschriften und Urkunden oder zur Hervorhebung von Annotationen in Druckerzeugnissen möglich. Aufgrund des generischen Konzeptes kann das Tool auch zur semantischen Annotation und Auszeichnung von Gemälden und Fotografien, z.B. zur Markierung von Motiven oder Arbeitstechniken, oder von Notendrucken genutzt werden.

Somit wird das Tool auch für andere Disziplinen wie etwa Geschichte, Kunstgeschichte, Archäologie, Musikwissenschaft etc. interessant.

Abb. 3: Transkription einer Manuscriptseite (hier Arthur Schnitzler: „Fräulein Else“) sowie Erfassung textgenetischer Merkmale

Transcribo ist sowohl für die Erfassung von Manuskripten als auch von Typoskripten geeignet: Marginalien, Textkorrekturen, handschriftliche Eigenheiten oder der Einsatz spezifischer Schreibgeräte können strukturiert erfasst und aufbereitet werden. Damit bietet dieses Werkzeug für die Abbildung von komplexen Textgenesen eine Fülle an Möglichkeiten, die unmittelbar bei der Arbeit auf dem digitalen Faksimile angewendet werden können.
Transcribo wird in enger Zusammenarbeit von Philologen und Informatikern der Kooperationspartner entwickelt. Die grafische Nutzeroberfläche ist um das digitale Faksimile, also in der Regel den gescannten Überlieferungsträger, zentriert. Beliebig große Einheiten (z.B. Wörter, Zeilen oder Absätze) können mittels eines Rechteck- oder Polygonwerkzeugs markiert, transkribiert und annotiert werden. Dabei wird jede Bilddatei doppelt dargeboten: links liegt das Original zur Ansicht, die rechte Version dient als Arbeitsunterlage, hier wird der transkribierte Text topografisch exakt über das leicht ausgegraute Faksimile gelegt. Wo die räumliche Anordnung nicht der textuellen Wortreihenfolge entspricht, können Wörter in der grafischen Oberfläche zu Sequenzen zusammengefasst und so die semantischen Zusammenhänge im Transkript protokolliert werden. Ein zentrales Merkmal des Programms liegt außerdem in der Möglichkeit, in jeder erfassten Einheit textgenetische und editionsphilologisch relevante Phänomene zu kennzeichnen und mit Annotationen zu versehen. Dabei kommt ein Kontextmenü mit einer projektspezifischen Auswahl zum Einsatz. Diese umfasst bisher unterschiedliche Varianten von Korrekturen (wie etwa Sofortkorrekturen, Spätkorrekturen mit ein-, zwei- oder mehrfacher Durchstreichung und Überschreibung), die Kennzeichnung von Hervorhebungen sowie von unsicheren Lesungen oder nicht identifizierten Graphen. Diese Auswahl ist jedoch beliebig erweiterbar und wird über den gesamten Projektverlauf hinweg an die Erfordernisse der Textgrundlage angepasst.

Aus den erfassten Informationen über jede einzelne Handschriftenseite lassen sich verschiedene Ansichten oder Fassungen (diplomatisch, genetisch, Lesefassung) des transkribierten Textes automatisch erstellen und synoptisch zum digitalen Original anzeigen. Ein „Relationen-Modul“ ermöglicht es den Benutzern, ausgehend von den Einzeltranskripten die hierarchische Gesamtstruktur eines Textes zu konstruieren. So können aus den transkribierten Wortformen topographische und syntaktische Zeilen, Relationen und Änderungsverbände sowie Sätze und Absätze aufgebaut werden. Diese wiederum können in hierarchisch übergeordnete Textstrukturen wie z.B. Szenen, Akte, Kapitel usw. zusammengefasst werden. Sie bilden damit die Eingabe für die anschließende Kollationierung der verschiedenen Textfassungen.

Zusätzlich verfügt das Transkriptionswerkzeug über eine entsprechende XML-basierte Datenschnittstelle zur virtuellen Forschungsumgebung FuD. Durch den Anschluss an die zugrundeliegende Datenbank wird eine „Transkript-Suche“ ermöglicht. Mit Hilfe dieser Funktionalität können die Benutzer den gesamten Bestand der erstellen Transkripte absuchen, wobei die Suchmöglichkeiten sowohl die erfassten Texte als auch sämtliche textgenetischen Phänomene umfasst. Aus der Datenbank werden als Ergebnis einer Suchanfrage die zugehörigen Transkripte ausgelesen und in einer übersichtlichen Trefferliste dargestellt. Von dort aus kann die jeweilige Originalseite mit markiertem Treffer aufgerufen werden.

Um die Transkription von Typoscript-Seiten zu erleichtern, bietet transcribo das unter Apache Licence stehende, frei nutzbare OCR-Werkzeug tesseract[11] als Zusatzwerkzeug an. Mit Hilfe dieses Moduls kann der Benutzer eine Vorerkennung der Wörter auf einer Typoscript-Seite berechnen lassen. Neben der Markierung der umschließenden Rechtecke werden die zugehörigen Transkripte erstellt und im System gespeichert. Da die Erkennungsrate sehr stark von der digitalen Vorlage abhängt, kann der Benutzer durch interaktive Regelung von Kontrast und Helligkeit des Faksimiles den OCR-Algorithmus steuern und damit die Qualität des Ergebnisses beeinflussen. Das Modul versteht sich dabei als Hilfswerkzeug, um grundsätzliche Aufgaben wie Segmentierung der Seite zu beschleunigen. Das Ergebnis erfordert in jedem Fall eine manuelle Kontrolle und Nachkorrektur.

Kollationierung

Zur Kollationierung, d.h. zum automatischen Vergleich mehrerer Versionen eines Textes, existiert eine Vielzahl an Werkzeugen. Hierzu gehören u. a. die Systeme Juxta[12], CollateX[13], Versioning Machine[14], TEI-Comparator[15] und TUSTEP[16], die in laufenden Editionsvorhaben eingesetzt werden. Doch eine Menge von entsprechenden Testfällen zeigt, dass keines dieser Werkzeuge alleine in der Lage ist, Textumstellungen und Textvariationen in größerem Umfang zu erkennen und geeignet darzustellen. Im Falle von großen Verschiebungen zwischen zwei Textstufen liefern die Vergleichsalgorithmen keine brauchbaren bzw. in einigen Fällen überhaupt keine Ergebnisse. Als Konsequenz daraus ergibt sich eine zweistufige Strategie, um durch einen Ähnlichkeitsvergleich zunächst die Umstellungen in einem Text zu identifizieren, daraus eine Konkordanz zwischen den betreffenden Blöcken zu erstellen, und anschließend die auf diese Weise ermittelten Textabschnitte paarweise miteinander zu vergleichen. Um diese mehrstufige Abfolge unterschiedlicher Algorithmen für die Benutzer leicht bedienbar zu gestalten, ist eine graphische Benutzerschnittstelle erforderlich. Mit Hilfe dieser Oberfläche können die Benutzer die Algorithmen durch Vorgabe von Parametern steuern und die berechneten Kollationierungsergebnisse interaktiv nachbearbeiten. Am Ende dieses Arbeitsschrittes steht ein Vergleichsergebnis zweier Textzeugen, das als Ausgangsbasis für die Erstellung des editionsphilologischen Kommentars dient.

Abb. 4: Automatischer Vergleich zweier Textstufen mit graphischer Darstellung der Textbezüge

Inhaltliche Erschließung

Für die Aufgaben in diesem Arbeitsschritt, der im wesentlichen einer inhaltlichen Analyse der Texte entspricht, stehen differenzierte Werkzeuge zur systematischen Textanalyse und -annotation zur Verfügung: eine Sachanalyse, deren Analyseschemata zur sachanalytischen Beschreibung der Texte verwendet werden können; eine Semantikanalyse, die mit der Wortfeld- und Argumentationsanalyse diskurslinguistische Werkzeuge bereitstellt; eine freie Analyse, mit der der Forscher individuelle, hierarchisch organisierte Kategorienschemata für Inhaltsanalysen oder Register aufbauen kann. Zur Auswertung der Textanalysen können die Ergebnisse (Textstellen) exportiert werden. Diese Werkzeuge zur Auszeichnung von Texten mit Kommentaren, Anmerkungen, persönliche Notizen, bibliographische Nachweise bieten zusätzlich die Möglichkeit der Vernetzung mit den Einträgen des Bibliographiemoduls. Für die Registererstellung steht hier ebenfalls ein Kategorienschema zur Verfügung, das eine einheitliche Erschließung von Personen, Orten und Institutionen ermöglicht. Durch die Vernetzung mit zentralen Ressourcen wie beispielsweise der GND können hier auch projekt- und disziplinenübergreifende Erschließungssysteme aufgebaut werden.

Abb. 5: Inhaltliche Erschließung (hier Aufbau eines Personenregisters) der Korrespondenzen August Wilhelm Schlegels

Kommentierung und Redaktion

Die Werkzeuge für diesen Arbeitsschritt sind dem traditionellen Herstellungsprozess eines Buches von der Texterstellung, über die fachliche Prüfung bis hin zur Generierung eines Rohsatzes nachempfunden. Zunächst werden die in den vorherigen Schritten in der Inventarisierungs- und Analyseumgebung erfassten und bearbeiteten Textquellen in die Redaktionsumgebung übernommen. Über die Benutzerverwaltung und einen auf die wissenschaftlichen Bedürfnisse abgestimmten Workflow können Autorengruppen auf einer gemeinsamen, stets aktuellen Datenbasis die Publikation erarbeiten und über ein Versionierungssystem die Enstehung eines Textes nachverfolgen und falls erforderlich auf einen älteren Zustand zurück gehen. Zusätzlich kann jedem Dokument ein Laufzettel beigefügt werden, der die Aufgaben und Vorgaben für die Texte in den unterschiedlichen Arbeits- und Korrekturphasen dokumentiert. Auf diese Weise kann die Organisation eines kollaborativen Publikationsprojektes erleichtert und der Arbeitsprozess detaillierter strukturiert werden. Ein typischer Ablauf besteht beispielsweise darin, dass der Autor zunächst einen Text erstellt und ihn danach zur redaktionellen Bearbeitung an den Lektor weiter gibt. Nach der fachlichen Prüfung und nach Abschluss der Redaktionsarbeiten kann die Publikation vom Herausgeber veröffentlicht werden.

Abb. 6: Parallele Darstellung zweier Textzustände sowie Anzeige der Differenzen für „Arthur Schnitzler: Digitale Edition“

Am Ende dieses gesamten Prozesses steht die Publikation der Daten und Texte, entweder traditionell in gedruckter Form oder als dynamische elektronische Publikation im Internet. Gemäß dem Prinzip des Single-Source-Publishing können mit Hilfe des Systems von einer einzigen Datenkodierung ausgehend die gewünschten Publikationsplattformen angesteuert werden, so kann also auch auf eine gedruckte Ausgabe durchaus später eine korrespondierende digitale erfolgen. Für den ersten Fall ist in die virtuelle Forschungsumgebung ein Satzmodul integriert, das jederzeit ein PDF-Dokument aus den Daten generieren und damit einen Rohsatzes generieren kann, der am Ende des Redaktionsprozesses die Vorlage für den Feinsatz der Buchpublikation bildet.

Publikation

Zu den wesentlichen Aufgaben bei der Erarbeitung einer digitalen Edition zählt die adäquate Präsentation der Arbeitsergebnisse im Internet. Sollte die Weboberfläche einerseits so nutzerfreundlich wie möglich sein, so muss sie andererseits den gängigen wissenschaftlichen Standards entsprechen. Grundlage einer digitalen Edition muss deshalb eine transparente Darstellung sein, d.h. neben der klaren Präsentation der Arbeitsergebnisse sowie der Editionsrichtlinien müssen auch die Voraussetzungen und Standards der Projektarbeit sichtbar gemacht werden.[17] Darüber hinaus sollte auf der Oberfläche deutlich auf die Benutzungsmöglichkeiten (Suchfunktionen, Darstellungsoptionen, Erklärungen der Symbole etc.) hingewiesen werden. Ein großer Vorteil einer virtuellen Forschungsumgebung im Mittelpunkt ist, dass nicht alle in der Datenbank gespeicherten Informationen gleichzeitig freigeschaltet werden müssen. Vielmehr entscheiden die Verantwortlichen, welche Datensätze zu einem bestimmten Datum für die Öffentlichkeit freigegeben werden und welche nicht. Bei einer Freischaltung sollte sofort sichtbar werden, in welchem Bearbeitungszustand sich die publizierten Materialien befinden und wie gründlich die wissenschaftliche Arbeit redigiert wurde.

Abb. 7: Perspektive zur Darstellung eines Überlieferungsträgers mit synoptischer Anzeige von Faksimile und Transkription am Beispiel von „Arthur Schnitzler: Digitale Edition“

Die Edition wird direkt aus den Daten gespeist, die in vorherigen Arbeitsschritten mit den Programmen FuD, Transcribo und Kollationierer generiert wurden. Zur Darstellung im Web werden diese aufbereitet und mit zusätzlichen Informationen angereichert. Die Benutzerschnittstelle der Website ist in zwei Hauptbereiche mit verschiedenen Perspektiven unterteilt: Zum einen in den „‘Überlieferungsträger“‘ (vgl. Abb. 6), wo das einzelne Blatt und seine Eigenschaften die zentrale Einheit darstellt, und zum anderen in die „,Textentstehung“‘, wo eine ganze Fassung eines Werks angezeigt und mit einer zweiten verglichen werden kann. In der Detailansicht des Überlieferungstträgers wird dessen Faksimile und die Tranksription einander gegenübergestellt. Die Faksimile-Ansicht ist dabei stufenlos vergrößerbar. Innerhalb der Transkription können die verschiedenen Zustände des Textes dargestellt werden, so dass die Genese innerhalb des Blattes ersichtlich wird. Darüber hinaus können die Registerzuordnungen einzelner Wörter hervorgehoben werden mit der Möglichkeit, nach anderen Vorkommnissen eines Lemmas zu suchen.
In der Perspektive „,Textentstehung“‘ werden ganze Fassungen eines Textes einander gegenübergestellt und miteinander verglichen. Dies wird zum einen durch ein detailliertes Vergleichsprotokoll ermöglicht, das vorher mit Hilfe des Kollationierers erarbeitet wurde, und zum anderen durch die in Transcribo erarbeiteten genetischen Informationen. Dadurch kann ein Vergleich sowohl zwischen Textzuständen innerhalb eines Textträgers als auch über die Textträger-Grenzen hinaus durchgeführt werden. Weil aus den vorherigen Arbeitsschritten stellengenaue Zuordnungen bekannt sind, kann der Benutzer jeden einzelnen Satz anwählen und bekommt automatisch dessen Entsprechung auf der jeweils anderen Seite angezeigt. Innerhalb dieses Satzes können sodann die einzelnen Änderungsstellen mit entsprechenden Kommentaren angezeigt werden.

Projektorganisation

Neben der technischen Organisation des Arbeitsablaufes spielt die Kommunikation zwischen den beteiligten Standorten eine zentrale Rolle. Ein mehrgliedriges und dezentral organisiertes Projekt wie die Erarbeitung einer digitalen Edition, die ein größeres Korpus umfasst, stellt die Mitarbeiter vor eine Vielzahl an Herausforderungen. Eine wichtige Voraussetzung ist, dass die einzelnen Partner in einem größeren Projekt ihre Rollen finden und dass man sich einig wird über die Ziele – womöglich kann man sich darüber sogar erst während der Arbeit vollends klar werden. Zu bedenken ist dabei, dass eine erste Erschließung relativ schnell gehen kann, eine Edition hingegen deutlich aufwendiger ist und Zeit kostet – auchvor allem im digitalen Medium.

Damit in Zusammenhang stehen die unterschiedlichen Interessenlagen der einzelnen Projektteile, die es aufeinander abzustimmen und zu synthetisieren gilt. Während beisiepielsweise eine Bibliothek vor allem daran interessiert ist, zügig ihre Bestände zu digitalisieren und im Internet bereitzustellen – mithin schnell eine hohe Zahl an frei zugänglichen Daten erreichen will –, geht es dem Philologen in erster Linie um eine differenzierte editorische Arbeit und die Einhaltung von allgemeinen philologischen Standards. Mit anderen Worten: Das Arbeitstempo der einzelnen Projektteile kann differieren und muss immer wieder neu aufeinander abgestimmt werden. Unabdingbar ist deshalb eine stetige Kommunikation zwischen den einzelnen Projektteilen bzw. seinen Mitarbeitern und die Bereitschaft, voneinander zu lernen.[18]

Indessen liegt in einer solchen Kooperation eine große Chance. Die Bibliothek ist nun unmittelbar an der inhaltlichen Erschließung ihrer Bestände beteiligt – Erschließung und Edition werden eng miteinander verzahnt, die komplexen Arbeitsprozesse aber auf mehrere Schultern verteilt. Umgekehrt wird die Arbeit des Literaturwissenschaftlers in einen größeren Zusammenhang eingebunden, so dass auch er sich auf die veränderten Bedingungen einstellen muss. Das sollte allerdings nicht heißen, dass er seine philologischen Prinzipien über Bord werfen muss – ohne die Einhaltung von grundlegenden Standards geht es nicht –, sondern vielmehr, dass er auch schon Teilergebnisse veröffentlichen kann und nicht erst die abgeschlossene Edition präsentieren muss. Auch der Informatiker wiederum hat seine eigenen Interessen: So möchte er im Hinblick auf die Präsentation eine möglichst einfache, schlanke Nutzbarkeit erreichen und zudem etwa seine Ideen zur Visualisierbarkeit der Edition erproben und demonstrieren. Hier ist eine enge Abstimmung mit den philologischen Interessen erforderlich. Das gilt auch für die Nachnutzung eines abgeschlossenen Projekts: Es muss sichergestellt werden, dass die Weboberfläche über das Projektende hinaus und im besten Fall von einer der beteiligten Institutionen fortlaufend gepflegt wird.

Hinweis:

* Der Beitrag fußt im Wesentlichen auf dem in Kürze erscheinenden Aufsatz: „Inventarisieren, Analysieren und Archivieren vernetzt. Digitalisierung und Edition größerer Briefkorpora mit der virtuellen Editionsplattform ‚Forschungsnetzwerk und Datenbanksystem‘ (FuD)“. In: Fontanes Briefe ediert. Hg. v. Hanna Delf von Wolzogen und Rainer Falk. Würzburg 2014, S.265–282 (gemeinsam mit Claudia Bamberg).

Anmerkungen:

[1] http://www.edirom.de/digitale-musikedition/wege-zu-digitalen-publikationen/born-digital/ [Stand: 16.02.2014]

[2] Ebd.

[3] Vgl. zur Definition und Beschreibung des Leistungsspektrums virtueller Forschungsumgebungen die im Februar 2011 veröffentlichte Definition der Arbeitsgruppe „Virtuelle Forschungsumgebungen“ in der Schwerpunktinitiative „Digitale Information“ in der Allianz der deutschen Wissenschaftsorganisationen: „Eine virtuelle Forschungsumgebung ist eine Arbeitsplattform, die eine kooperative Forschungstätigkeit durch mehrere Wissenschaftler an unterschiedlichen Orten zu gleicher Zeit ohne Einschränkungen ermöglicht. Inhaltlich unterstützt sie potentiell den gesamten Forschungsprozess – von der Erhebung, der Diskussion und weiteren Bearbeitung der Daten bis zur Publikation der Ergebnisse – während sie technologisch vor allem auf Softwarediensten und Kommunikationsnetzwerken basiert. Virtuelle Forschungsumgebungen sind wesentliche Komponenten moderner Forschungsinfrastrukturen.“ Online verfügbar unter http://www.allianzinitiative.de/de/handlungsfelder/ virtuelle_forschungsumgebungen/definition/ [Stand: 31.01.2014].

[4] http://www.fud.uni-trier.de/

[5] Vgl. zu den derzeit im Aufbau befindlichen VFUs insbesondere das CARPET-Verzeichnis unter http://www.carpet-project.net/projekte/projekte-und-anbieter/ [Stand: 31.01.2014].

[6] “The Trier FuD system can be seen as a model for a local research environment, providing collaborative services for the complete Humanities research process: data collection and analysis; preparation of publications; and publishing and archiving.” European Science Foundation (2011): Science Policy Briefing. Research Infrastructures in the Digital Humanities, S. 20. Online verfügbar unter http://www.esf.org/fileadmin/Public_documents/Publications/spb42_RI_DigitalHumanities.pdf [Stand: 31.01.2014].

[7] http://august-wilhelm-schlegel.de/

[8] http://www.openarchives.org/

[9] http://www.transcribo.org/

[10] http://www.arthur-schnitzler-digital.de

[11] http://code.google.com/p/tesseract-ocr/

[12] http://www.juxtasoftware.org

[13] http://collatex.net/

[14] http://v-machine.org/

[15] http://tei-comparator.sourceforge.net/

[16] http://www.tustep.uni-tuebingen.de/

[17] Vgl. hierzu detailliert die Beiträge von Patrick Sahle, Daniel Hochstrasser und Peter Stadler in diesem Band (= Fontanes Briefe ediert. Hg. v. Hanna Delf von Wolzogen und Rainer Falk. Würzburg 2014).

[18] Vgl. aktuell: Eva Christina Glaser: Digitale Edition als Gegenstand bibliothekarischer Arbeit. Berlin 2013.