iSquare ePaper Manager

Der iSquare ePaper Manager im Einsatz bei der Deutschen Nationalbibliothek (DNB)

Aus Kosten- sowie Platzgründen, aber auch um den strukturellen Veränderungen der Medien- und Informationsgesellschaft Rechnung zu tragen, wird 2009 das Pilotprojekt zur Sammlung layoutgetreuer E-Paper von Tageszeitungen aufgesetzt. In enger Zusammenarbeit zwischen der iSquare GmbH und der DNB wird der Workflow zur Sammlung, Aufbereitung, Erschließung und Bereitstellung von E-Paper-Ausgaben entwickelt. Das Ergebnis ist der iSquare ePaper Manager, eine Softwarelösung, die für Bibliotheken eine moderne Alternative darstellt, gedruckte Zeitungen im Lesesaal mit Zusatznutzen bereit zu stellen.

Die Vorgeschichte

Der Siegeszug des Internets hat strukturelle Veränderungen der Informations- und Medienlandschaft mit sich gebracht. Die meisten Verlage von Tageszeitungen, Zeitschriften und Magazinen haben längst darauf reagiert und stellen elektronische Faksimile ihrer gedruckten Ausgaben bereit.

Das Ziel

Die DNB will die Bereitstellung von Tageszeitungen nachhaltig verbessern. Unter strikter Beachtung der urheberrechtlichen Beschränkungen soll die Ablösung der Verfilmung neben Einsparmöglichkeiten hinsichtlich Kosten und Lagerfläche auch die zügige Archivierung und damit den schnelleren Zugriff auf die Ausgaben ermöglichen.

Die Ausschreibung

Im Herbst 2009 schreibt die DNB das Projekt europaweit aus. Ausschlaggebend für den Gewinn des E-Paper-Projekts ist die langjährige Erfahrung der iSquare GmbH bei der automatischen Sammlung von Netzressourcen und der Konvertierung von Daten in ein einheitliches Zielformat.

Das Projekt

In enger Zusammenarbeit mit der DNB entwickelt die iSquare GmbH einen vollautomatischen Workflow. Die E-Paper-Ausgaben werden täglich von den Verlagsservern abgeholt und in das einheitliche Format PDF/A-1b konvertiert. Damit sind optimale Voraussetzungen für die Langzeitarchivierung geschaffen.

Zu jeder Ausgabe wird ein XML-Metadatensatz erstellt. Dieser enthält unter anderem das Datum und die Seitenzahl einer Ausgabe sowie die Identnummer des E-Papers. Dies bildet die Grundlage für die automatische Verzeichnung der Ausgaben im Katalogsystem der DNB und die Zuordnung der Ausgaben zum richtigen Titelsatz.

Anschließend spielt die DNB die Daten in ihre Systeme ein, legt die E-Paper-Ausgaben auf ihrem Archivserver ab und verzeichnet sie automatisch in ihrem Katalog, sodass sie für die Benutzung im Lesesaal zur Verfügung stehen.

Die Herausforderungen

Nicht ganz einfach ist die Automatisierung der Sammlung hinsichtlich der Vielzahl unterschiedlicher Zugriffsszenarien sowie Bereitstellungs- und Downloadvarianten. Z.B. sind bei den Verlagen die Log-In-Seiten und Klickpfade zu den zu sammelnden Ausgaben verschieden strukturiert.

Auch die Auswahl eines E-Papers aus mehreren angebotenen Titeln oder die Identifikation aller zu einer Ausgabe gehörenden Einzeldateien könnten den automatischen Prozess behindern oder gar gänzlich unmöglich machen – erst recht, wenn Links zu den Dateien oder Dateinamen nicht einheitlich strukturiert sind bzw. von Zeit zu Zeit gar wechseln.

Der iSquare ePaper Manager lässt sich jedoch äußerst flexibel konfigurieren, so dass alle Besonderheiten dieser Art Beachtung finden. Auch beim Download kann die Software mit einer Vielzahl von Einzelseiten sowie mit ZIP-Files je Ausgabe umgehen, sogar in Abhängigkeit differierender, nicht unbedingt garantierter Bereitstellungszeiten.

Der Stand

Aktuell sind rund 300 laufend erscheinende E-Paper mit PDF-Download Möglichkeit in den Workflow der DNB integriert. So kommen von Montag bis Samstag rund 1.800 neue Ausgaben ins Haus, außerdem wöchentlich die Ausgaben von 16 Sonntagszeitungen. Der Umfang der angebotenen Ausgaben von deutschen Tageszeitungen, Zeitschriften und Magazinen wird kontinuierlich erweitert.

Der Zusatznutzen

Durch die Sammlung von E-Papern hat sich das Angebot für die Besucher/innen der DNB deutlich verbessert. Einzelne E-Paper-Ausgaben können gezielt gesucht und unmittelbar aus dem Katalog heraus per Mausklick aufgerufen werden.

Dauerte früher die Bereitstellung der Tageszeitungen auf Mikrofilm drei bis vier Monate, so können die digitalen Ausgaben heute direkt nach ihrem Erscheinen in den Lesesälen genutzt werden.