Standards und technische Umsetzung

Der wissenschaftliche Apparat wurde soweit wie möglich unter Verwendung der digitalen Ressourcen der European Holocaust Research Infrastructure (EHRI) erstellt.

EHRI, ein internationales Forschungskonsortium, das aus Mitteln des FP7- bzw. Horizon 2020 Programms der Europäischen Union finanziert wird, zielt auf eine Verbesserung des Zugangs zu verstreuten Holocaustrelevanten Archivsammlungen, bietet Normdatensätze an, entwickelt neue Methoden digitaler Historiographie und unterstützt die Holocaust-Forschungsgemeinschaft.

Die hohe Qualität der EHRI-Beschreibungen von Archiven, Sammlungen, Schlagworten, Lager und Ghettos sowie Organisationen und Einzelpersonen machte es nicht nur möglich, verlässliche Informationen in die Edition aufzunehmen, sondern erlaubte es darüber hinaus, zu den Ressourcen der Forschungsinfrastruktur zu verlinken.

Für Ortsnamen verwendete das Projekt das frei zugängliche Portal Geonames.org. Dies machte nicht nur die Verlinkung zu autoritativen Einträgen möglich, sondern erlaubte auch, die in die Edition integrierten Dokumente durch Geo-Referenzierung kartografisch zu verorten.

Die Daten wurden in XML/TEI (Text Encoding Initiative) im P5 Format, einem de facto Standard für textbasierte Editionen, kodiert. Eine Untergruppe von Metadatenelementen wurde speziell aufbauend auf dem TEI Namesdates Module definiert.

Der editorielle Prozess folgte dem Linked Data Paradigma: Zuerst markierten die Editoren Begriffe in den Dokumenten durch die Verwendung von Verlinkungen zu autoritativen Wortverzeichnissen und Datensätzen (z.B. durch Verlinkung zu den URLs im EHRI-Portal). Eine Konvertierung unter Verwendung von Odette und eines XSL-Stylesheets mit EHRI-Regeln erstellte TEIs aus den LibreOffice Dokumenten. Das Stylesheet erkennt unterschiedliche Typen von markierten Begriffen anhand ihrer URL (z.B. dass ein link zu Geonames.org einen Ort bezeichnet und daher in TEI als <placeName> ausgegeben wird).

Nach einem Clean-Up der TEI Kodierung und der manuellen Kodierung von Metadaten im TEI-Header, extrahierte ein Dienstprogramm, das eigens für EHRI Editionen entwickelt wurde, die über die Geoname RDF records und die EHRI API verfügbaren Informationen und fügte angereicherte normalisierte Einträge für Orte, Schlagworte, Organisationen und Personen im TEI-Header. Für Orte holte das Dienstprogramm auch Koordinaten heraus, was es möglich macht, diese auf einer Karte anzuzeigen.

Das Frontend der Edition basiert auf der Omeka open-source Web-Plattform, die weitgehend von Museen, Archiven und kulturellen Einrichtungen verwendet wird, um digitale Sammlungen zu publizieren. Dabei wurde ein TEI Editionen-Plugin für Omeka verwendet, das durch das EHRI-Projekt entwickelt wurde und es erlaubt, Einträge aus den hochgeladenen TEI-Files in Omeka zu erstellen und mit Metadaten zu befüllen.

Die in TEI markierten Entitäten steuern das Facetted Browsing und erlauben es, nach Entitäten wie Orte, Begriffen etc. zu filtern. Die Edition verwendet ein für EHRI entwickeltes Omeka Theme, welches das Interface an die Anzeige von TEI basierten Texten anpasst und Annotationen und andere kontextuellen Informationen anzeigt.

Die Edition legt einen Schwerpunkt auf die kartenbasierte Visualisierung der Bewegungsbahnen von Flucht und die Interaktionen im Grenzgebiet wie auch im Landesinneren. Dafür wurde das Omeka Plugin Neatline verwendet, das es, neben anderen Funktionalitäten, erlaubt, den Text neben einer Karte zu lesen und somit dem Narrativ im Raum zu folgen.