Allgemein

Damit eine Verarbeitung der Daten erfolgen kann und der automatisierte Prozess später reibungslos funktioniert, benötigen wir zu Beginn des Projekts einmalig einige Informationen von Ihnen. Diese dienen der Abstimmung zwischen Ihnen, dem XML-Dienstleister und uns.


Zusätzlich müssen die angelieferten PDF Dateien bestimmten Vorgaben entsprechen, um Verarbeitungsfehler auszuschließen. 



Anleitung


PubCodes

Damit ein Lesemodus zu einer PDF Ausgabe hinzugefügt werden kann wird zuerst ein sogenannter Pubcode vergeben, der mit der Publikation verknüpft wird. In der Regel wird der PubCode angelehnt an den Namen der Publikation vergeben. 


Heißt ihr Magazin also Atlas der Zoologie könnte der PubCode ADZ heissen, insofern er noch nicht vergeben ist.

Dieser PubCode ist wichtig für die Zuordnung bei unserem Dienstleister und wird als ein Teil des Dateinamens beim Versand mit verwendet. Den konkreten PubCode teilen wir Ihnen nach Abstimmung mit dem Dienstleister mit.


Anlieferungstabelle

Damit die Einrichtung ohne Verzögerung ablaufen kann muss vor Beginn der Verarbeitung eine Tabelle ausgefüllt und an uns zurückgesendet werden. 


Die Tabelle besteht aus folgenden Spalten:


  • filename
  • pubcode
  • issue name
  • delivery date
  • publication date
  • estimated page numbers


Eine Vorlage können Sie hier oder am Ende des Artikels herunterladen.


Filename 

ist der Name der immer als ZIP Datei angelieferten PDF Daten. Diese werden üblicherweise aus dem PubCode und dem Veröffentlichungsdatum (publication date) gebildet.


Habe ich also eine Ausgabe vom Atlas der Zoologie (Pubcode: ADZ) für den Monat März im Jahr 2020 mit einem Veröffentlichungsdatum 01.03.2020, würde der Dateiname wie folgt aussehen:


adz_20200301.zip


Somit ist eine genau Zuordnung der Datei möglich und eine reibungslose Verarbeitung der Daten sichergestellt.


pubcode

Der im Absatz PubCodes beschriebene PubCode der Ausgabenreihe bzw. Publikation


issue name

ist der Name der Ausgabe wie sie der Leser später zum Beispiel in der App oder im Web sehen wird, also zum Beispiel "Atlas der Zoologie März 2020"


delivery date

ist das Datum zu dem die Zip Datei von Ihnen auf unseren SFTP Server bereitgestellt wird. Dieses Datum muss vor dem Veröffentlichungsdatum liegen. 


publication date

ist das Datum zu dem die Ausgabe live geschaltet und den Lesern zur Verfügung gestellt wird.


estimated page numbers

ist eine ungefähre Angabe der Seitenzahl der betroffenen Ausgabe. Dieser Wert ist notwendig für die Abschätzung der Verarbeitungsdauer, Kosten und zur Prüfung einer korrekten Verarbeitung


PDF Vorgaben


Vorgaben PDF Dokumentstruktur

  • Es dürfen keine schreibgeschützten PDFs verwendet werden
  • Alle Seiten sollten Einzelseiten sein.
  • Alle Seiten sollten in der richtigen Reihenfolge angeordnet sein.
  • Trimboxen sollten immer korrekt eingestellt sein, also nur die relevanten Seiteninformationen ohne Beschnitt enthalten und sich nicht mit der gegenüberliegenden Seite der Doppelseite überschneiden.
  • Die Daten müssen als Zip Datei angeliefert werden

Vorgaben PDF Text

  • Alle Texte und Schriften müssen vollständig in PDFs eingebettet sein.
  • Der Text sollte nicht gerastert oder mit Pfaden versehen sein.
  • Der gesamte Text wird so extrahiert, wie er in den PDFs enthalten ist. Wenn Glyphen oder spezielle Schriftarten verwendet werden, die das Aussehen eines Zeichens verändern, wird nur das Zeichen extrahiert.

Vorgaben PDF Bilder

  • Bilder sollten nicht auf den Hintergrund reduziert werden, damit sie als separate Objekte extrahiert werden können.
  • Down-Sampling sollte nach Möglichkeit vermieden werden. Aus Gründen der Dateigröße ist ein gewisses Down-Sampling vorzuziehen.
  • Ziel ist es, bei großen Bildern eine scharfe Darstellung mit maximal 2400px Breite oder Höhe zu gewährleisten.
  • Bilder mit 300DPI+ werden bevorzugt, solange die Größe einer Ausgabe ~300MB nicht überschreitet. Übersteigt die Ausgabe 300MB, verkleinern Sie die Bilder bitte auf etwa 150DPI und/oder verwenden Sie eine bessere Komprimierung.
  • RGB-Farbraum