Allgemein

Damit eine Verarbeitung der Daten erfolgen kann sind zu Beginn des Projekts einige Daten einmalig abzustimmen, damit de automatisierte Prozess später reibungslos funktioniert.


Anleitung

PubCodes

Damit ein Lesemodus zu einer PDF Ausgabe hinzugefügt werden kann wird zuerst ein sogenannter Pubcode vergeben, der mit der Publikation verknüpft wird. In der Regel wird der PubCode angelehnt an den Namen der Publikation vergeben.


Heißt ihr Magazin also Atlas der Zoologie könnte der PubCode ADZ heissen, insofern er noch nicht vergeben ist.

Dieser PubCode ist wichtig für die Zuordnung bei unserem Dienstleister und wird als ein Teil des Dateinamens beim Versand mit verwendet.


Anlieferungstabelle

Damit die Verarbeitung ohne Verzögerung ablaufen kann muss vor Beginn der Verarbeitung eine Tabelle ausgefüllt und an uns zurückgesendet werden, damit der Prozess korrekt aufgesetzt werden kann.




Die Tabelle besteht aus folgenden Spalten


  • filename
  • pubcode
  • issue name
  • delivery date
  • publication date
  • estimated page numbers


Eine Vorlage können Sie hier oder am Ende des Artikels herunterladen.


Filename 

ist der Name der immer als ZIP Datei angelieferten PDF Daten. Diese werden üblicherweise aus dem PubCode und dem Veröffentlichungsdatum (publication date) gebildet.


Habe ich also eine Ausgabe vom Atlas der Zoologie (Pubcode: ADZ) für den Monat März im Jahr 2020 mit einem Veröffentlichungsdatum 01.03.2020 so würde der Dateiname wie folgt ausschauen:


adz_20200301.zip


Somit ist eine genau Zuordnung jederzeit möglich und eine reibungslose Verarbeitung der Daten sichergestellt.


pubcode

ist das im ersten Absatz beschriebene Kürzel für die Ausgabenreihe


issue name

ist der Name der Ausgabe wie sie der Leser später zum Beispiel in der App oder im Web sehen wird, also zum Beispiel "Atlas der Zoologie März 2020"


delivery date

ist das Datum zu dem die Zip Datei von Ihnen auf unseren SFTP Server bereitgestellt wird. Dieses Datum muss vor dem Veröffentlichungsdatum liegen.


publication date

ist das Datum zu dem die Ausgabe live geschaltet und den Lesern zur Verfügung gestellt wird.


estimated page numbers

ist eine ungefähre Angabe der Seitenzahl der betroffenen Ausgabe. Dieser Wert ist notwendig für die Abschätzung der Verarbeitungsdauer, Kosten und für Prüfung einer korrekten Verarbeitung


Vorgabe PDF Dokumentstruktur

  • Es dürfen keine schreibgeschützten PDFs verwendet werden
  • Alle Seiten sollten einseitig sein.
  • Alle Seiten sollten in der richtigen Reihenfolge angeordnet sein.
  • Trimboxen sollten immer korrekt eingestellt sein, um nur die relevanten Seiteninformationen ohne Beschnitt oder sich mit der gegenüberliegenden Seite der Doppelseite überschneiden.
  • Die Daten müssen als Zip Datei angeliefert werden

Vorgaben PDF Text

  • Alle Texte und Schriften müssen vollständig in PDFs eingebettet sein.
  • Der Text sollte nicht gerastert oder mit Pfaden versehen sein.
  • Der gesamte Text wird so extrahiert, wie er in den PDFs enthalten ist. Wenn Symbole  oder spezielle Schriftarten verwendet werden, die das Aussehen eines Zeichens, wird nur das Zeichen extrahiert.

Vorgaben PDF Bilder

  • Bilder sollten nicht auf den Hintergrund reduziert werden, damit sie als separate Objekte extrahiert werden können.
  • Down-Sampling sollte nach Möglichkeit vermieden werden. Aus Gründen der Dateigröße ist ein gewisses Down-Sampling vorzuziehen.
  • Ziel ist es, bei großen Bildern eine scharfe Darstellung mit maximal 2400px Breite oder Höhe zu gewährleisten.
  • Bilder mit 300DPI+ werden bevorzugt, solange die Größe der Ausgabe ~300MB nicht überschreitet. Übersteigt die Ausgabe 300MB, verkleinern Sie die Bilder bitte auf etwa 150DPI und/oder verwenden Sie eine bessere Komprimierung.