<PlaceObject>
<Image file="ocean.pdf" width="10" height="3" clip="no"/>
</PlaceObject>
Bilder in das PDF einfügen ist sehr einfach, es reicht ein kurzer Befehl:
<Record element="data">
<PlaceObject>
<Image file="_samplea.pdf" width="5cm"/>
</PlaceObject>
</Record>
Das Bild _samplea.pdf
ist (wie _sampleb.pdf
) Bestandteil des Publishers und für Testzwecke gut nutzbar.
Als Bildformate sind PDF, PNG und JPEG möglich.
Andere Formate müssen vor der Verarbeitung in eines dieser Formate konvertiert werden.
Wenn das Programm inkscape installiert ist, wird das genutzt um Dateien im SVG-Format automatisch nach PDF zu konviertieren (siehe dazu den Abschnitt über Konfiguration - dort können auch die Kommandozeilenparameter für die Konvertierung gesetzt werden).
Das Format, das in der Praxis am wenigsten Probleme
bereitet ist PDF. Hier können auch Farbprofile eingebettet werden.
Die Bilder werden bei der Verarbeitung im Publisher nicht verändert, das heißt, sie behalten unter anderem ihre ursprüngliche (Datei-)Größe bei. Bei sehr großen Bildern ist die Verarbeitungsgeschwindigkeit geringer und die Größe der resultierenden PDF-Datei nimmt natürlich zu. Daher kann es sich lohnen, für die Verarbeitung spezielle Versionen mit kleineren Dateigrößen bereit zu halten.
Wenn man Bilder einbindet, dann ist es immer sinnvoll, eine Größenangabe mitzugeben. Ansonsten wird die natürliche Größe des Bildes genommen. Was die natürliche Größe ist, ist nicht immer eindeutig zu sagen. In der Regel gibt es in der Bilddatei eine DPI-Angabe. Die ist oftmals willkürlich vom Bildbearbeitungsprogramm gesetzt. Wenn dort beispielsweise 72 DPI steht, ist ein 720 Pixel breites Bild 10 Zoll breit; bei 300 DPI nur 2,4 Zoll.
Da man sich auf die Angabe nicht verlassen kann, werden Größenangaben für die Ausgabe benötigt.
Das kann entweder die gewünschte Höhe oder die gewünschte Breite des Bildes sein, oder beide Angaben zusammen.
Im Beispiel oben hat das Bild eine Breite von fünf Zentimeter.
Die Angabe kann auch als Anzahl von Rasterzellen gemacht werden.
Die Angabe von width="100%"
bedeutet, dass die gesamte verfügbare Breite genutzt werden soll (derzeit werden andere Prozentangaben noch nicht unterstützt).
Die Angabe auto
ist wie das Weglassen der Angabe und ist nur wegen der Kompatibilität zu CSS vorhanden.
Wenn beide Proportionen angegeben sind (Breite und Höhe) gibt es zwei Modi:
Beibehalten des Seitenverhältnisses (clip="yes"
) oder Strecken bzw. Stauchen (clip="no"
) der Ausgabe.
<PlaceObject>
<Image file="ocean.pdf" width="10" height="3" clip="no"/>
</PlaceObject>
Mit clip="yes"
ist das Bild so ausgeschnitten, dass auf einer Seite die maximalen Ausmaße genommen werden
<PlaceObject>
<Image file="ocean.pdf" width="10" height="3" clip="yes"/>
</PlaceObject>
Die Größe von Bildern kann man mit den beiden XPath-Funktionen
sd:imagewidth(<Dateiname>)
und sd:imageheight(<Dateiname>)
ermitteln. Das
Ergebnis ist in Rasterzellen. Vorsicht, hier wird die natürliche Größe
genommen, die gegebenenfalls ohne Aussagekraft ist (s.o.).
Um die natürliche Größe zu benutzen, aber Einschränkungen anzugeben, gibt es die vier Kombination aus min/max und width/height. Das Bild in dem folgenden Beispiel wird nicht breiter als 10 Rasterzellen und nicht höher als 3. Das Seitenverhältnis bleibt erhalten:
<PlaceObject>
<Image file="forest.jpg" maxwidth="10" maxheight="3" />
</PlaceObject>
Falls die natürliche Größe des Bildes kleiner ist als die vorgegebenen Angaben von maxwidth
und maxheight
, kann man stretch
auf yes
setzen, um das Bild so weit zu vergrößern, bis eine der beiden Einschränkungen erreicht wird.
Mit dem Attribut rotate
kann man Bilder in 90 Grad Schritten drehen (positive Werte: im Uhrzeigersinn).
Das nachfolgende Beispiel dreht ein Bild um 90 Grad gegen den Uhrzeigersinn, wenn es sich um ein Hochformat-Bild handelt.
Mit dem XPath-Befehl sd:aspectratio(<Dateiname>)
kann man das Seitenverhältnis eines Bildes ermitteln.
Wenn es größer als 1 ist, dann handelt es sich um ein Bild im Querformat.
<data>
<img file="_samplea.pdf" />
<img file="_sampleb.pdf" />
</data>
<Layout xmlns:sd="urn:speedata:2009/publisher/functions/en"
xmlns="urn:speedata.de:2009/publisher/en">
<Record element="data">
<ForAll select="img">
<PlaceObject>
<Image file="{@file}" width="5"
rotate="{if ( sd:aspectratio(@file) < 1 ) then '-90' else '0'}"/>
</PlaceObject>
</ForAll>
</Record>
</Layout>
Die geschweiften Klammern bei file und rotate bedeuten, dass in den XPath-Modus gesprungen wird, um die XPath-Ausdrücke (Zugriff auf das Attribut file und die Wenn-Dann-Abfrage) auszuwerten. Mehr dazu im Abschnitt XPath- und Layoutfunktionen.
|
Achtung: ist das Bild im Argument von sd:aspectratio()
nicht im Dateisystem vorhanden, wird der Wert von dem Platzhalterbild (Kapitel Bild nicht gefunden?) genommen. Um zu überprüfen, ob ein Bild überhaupt vorhanden ist, kann man den Befehl sd:file-exists(<Dateiname>)
benutzen.
Meist liegen die Bilder im Dateisystem oder in einem DAM (digital asset management). Im Dateisystem können sie entweder mit einem absoluten Pfad angesprochen werden:
<Image file="file:///path/to/the/image.pdf" />
oder als Datei in einem der Unterverzeichnisse des Suchpfads, wie in den Beispielen oben.
Beispielweise können die Bilder in dem Unterverzeichnis images
liegen.
Siehe dazu den Abschnitt über Dateiorganisation.
Die Bilder können auch mittels http(s)-Protokoll von einem Webserver geladen werden. Die Syntax ist analog zum Beispiel mit dem absoluten Pfad:
<Layout xmlns="urn:speedata.de:2009/publisher/en" >
<Record element="data">
<PlaceObject>
<Image file="http://placekitten.com/g/400/300" width="5"/>
</PlaceObject>
</Record>
</Layout>
Die Bilder, die über http und https geladen werden, werden auf der Festplatte zwischengespeichert. Bei jedem Request wird überprüft, ob das Bild noch aktuell ist und ggf. nicht herunter geladen. Ist das Bild auf dem Server gelöscht, wird es auch im lokalen System gelöscht.
Mit sp --cache=fast
kann man auf die schnelle Caching-Methode zurückgreifen, die das Bild nur einmal vom Server herunter lädt und dann nicht wieder auf Aktualität prüft.
Mit dem Befehl sp clearcache
wird der Zwischenspeicher gelöscht.
Der Ort, wo der Bildercache liegt, kann entweder über tempdir
(Kommandozeile und Konfigurationsdatei) gesteuert werden oder über den Schlüssel imagecache
in der Konfigurationsdatei (nicht auf der Kommandozeile).
Was passiert, wenn ein Bild nicht gefunden wird? Das normale Verhalten ist die Ausgabe einer Fehlermeldung und einem Platzhalterbild, das das Fehlen anzeigt:
<PlaceObject>
<Image file="doesnotexist" width="5"/>
</PlaceObject>
Eine andere Möglichkeit besteht darin, mit fallback
ein Platzhalterbild selber zu bestimmen:
<PlaceObject>
<Image file="doesnotexist" fallback="......" width="5"/>
</PlaceObject>
Man kann auch noch einstellen, ob es ein Fehler ist, wenn ein Platzhalterbild ausgewählt wird, oder nur eine Warnung.
<Options imagenotfound="error"/>
bzw. warning
für eine Warnung.
PDF-Dateien haben einige Besonderheiten:
sie können mehrere Seiten enthalten und die einzelnen Seiten haben verschiedene Boxen, die den sichtbaren Bereich und andere Bereiche markieren.
Manche der Boxen sind für den Ausdruck wichtig, manche für die Ansicht im PDF-Anzeigeprogramm.
Die Box, die mit den angegebenen Größen angezeigt werden soll, wird mit dem Attribut visiblebox
bestimmt:
<Image file="seite.pdf" visiblebox="artbox" width="210mm" height="297mm" />
bedeutet, dass die »artbox« in der Größe 210mm × 297mm dargestellt wird.
Das Attribut page
wird auch im Abschnitt Mehrseitige PDF-Dateien einbinden beschrieben.
Er dient dazu, die Seite auszuwählen, wenn eine PDF-Datei eingebunden wird.
Mit sd:number-of-pages(‹Dateiname›)
kann ermittelt werden, wie viele Seiten eine PDF-Datei enthält.
Einige Layoutfunktionen (sd:aspectratio()
, sd:imageheight()
und sd:imagewidth()
) greifen auf Bilddateien zu.
Im Falle einer PDF Datei, kann man neben dem Dateinamen die Seite und die gewünschte PDF-Box angeben.
Diese Angaben sind optional.
Beispiel: sd:aspectratio("ocean.pdf",1,"cropbox")
Falls keine Box angegeben wird, wird die cropbox benutzt. Mögliche Werte für die Box-Angabe: artbox
, cropbox
, trimbox
, mediabox
und bleedbox
.
Der Publisher verarbeitet in der Regel nur PDF, PNG und JPEG Dateien. Um andere Formate nutzen zu können, muss man sie in eines der drei Formate umwandeln. Das kann im Vorfeld gemacht werden, aber auch zur Laufzeit des Publishers.
<Layout xmlns="urn:speedata.de:2009/publisher/en"
xmlns:sd="urn:speedata:2009/publisher/functions/en">
<Record element="data">
<PlaceObject>
<!-- tiff can only be used with an external converter -->
<Image file="rhslogo.tiff"/>
</PlaceObject>
</Record>
</Layout>
Um die Konvertierung zu nutzen, muss man die Programmaufrufe in der Konfigurationsdatei eintragen. Hier wird das Programm convert
von ImageMagick genutzt:
imagehandler="tiffimage:(convert %%input%% %%output%%.pdf)"
extensionhandler="tiff:tiffimage"
Der Dateinamenendung .tiff
wird der Handler tiffimage
zugeordnet (Zeile 2). In der ersten Zeile wird dem Handler tiffimage
dem Programm convert %%input%% %%output%%.pdf
, wobei die Dateinamen zur Laufzeit ersetzt werden. Wenn Leerzeichen in Dateinamen enthalten sind, müssen die Ersetzungen wie %%input%%
in Anführungszeichen (ohne Schrägstrich o.ä. davor) gesetzt werden:
imagehandler="tiffimage:("/path/with space/convert" "%%input%%" "%%output%%.pdf")"
Es gibt unzählige Bildbeschreibungssprachen, in denen Bilder nicht mit einem externen Programm gezeichnet oder gemalt werden, sondern textuell beschrieben werden. Z.B. »zeichne ein Quadrat mit der Kantenlänge 4cm« oder »erstelle ein Tortendiagramm mit den folgenden Werten: ….«. Diese Grafiken werden dann aus der Beschreibungssprache in verschiedene Formate umgewandelt, meist als PNG oder PDF. Mit dem Publisher ist es seit Version 3.9.1 möglich, solche Beschreibungen einzubetten:
<Layout xmlns="urn:speedata.de:2009/publisher/en"
xmlns:sd="urn:speedata:2009/publisher/functions/en">
<Record element="data">
<PlaceObject>
<!-- we need to specify the imagetype -->
<Image width="7cm" imagetype="mermaid" >
<Value>sequenceDiagram
participant Alice
participant Bob
Alice->>John: Hello John, how are you?
loop Healthcheck
John->>John: Fight against hypochondria
end
Note right of John: Rational thoughts <br/>prevail!
John-->>Alice: Great!
John->>Bob: How about you?
Bob-->>John: Jolly good!
</Value>
</Image>
</PlaceObject>
</Record>
</Layout>
Notwendig ist natürlich die Konfiguration, wie der externe Konverter aufgerufen wird. Das funktioniert analog zu dem TIFF-Beispiel im vorherigen Abschnitt:
imagehandler="mermaid:(/usr/bin/mmdc -i %%input%% -o %%output%%.pdf)"
Das Ergebnis ist Ein Sequenzdiagramm, von mermaid
erzeugt und nach PDF konvertiert.
Natürlich ist es auch möglich, die Bildbeschreibung aus den Daten zu entnehmen. Dazu muss der Image-Befehl wie folgt aufgebaut werden.
<PlaceObject>
<Image width="7cm" imagetype="mermaid" >
<Value select="imagedata" />
</Image>
</PlaceObject>
Zu MetaPost gibt es ein eigenes Kapitel. Hier ist jedoch gezeigt, mit welchen Möglichkeiten diese Grafiken eingebunden werden können:
.mp
:
<Image file="myfile.mp" />
metapost
:
<Image width="7cm" imagetype="metapost">
<Value>....</Value>
</Image>
Siehe auch das Kapitel über MetaPost sowie die MetaPost-Beispiele.
Große Bilddateien erzeugen auch große PDF-Dateien, wenn sie eingebunden werden, unabhängig davon, wie breit und hoch sie im PDF dargestellt werden.
Möchte man die Auflösung (und damit die Dateigröße) begrenzen, kann man dies mit der dpi
-Option bei PDFOptions erreichen.
DPI steht für Punkte pro Zoll (dots per inch) und ist eine Maßeinheit für die Pixeldichte.
Je geringer die Zahl, desto »schlechter« sieht das Bild aus.
Durch eine Begrenzung der Auflösung erhält man teilweise wesentlich kleinere Dateien.
Beispiel: soll ein Bild mit der Breite von 720 Pixeln auf einer Papierbreite von 1 Zoll (inch) dargestellt werden, wäre die Auflösung im PDF 720 dpi. In der Regel ist eine so hohe Auflösung nicht notwendig. Je nach Anwendungsfall (Druck/Onlinebetrachtung) kann z.B. eine Auflösung von 300 dpi oder 120 dpi ausreichend sein.
padding-*
-Angaben festlegen, wie viel Abstand das Bild vom entsprechenden Rand haben soll.
dpiwarn
kann eine Warnung herausgegeben werden, wenn die tatsächliche Anzahl der Pixel je Zoll geringer ist, als die Vorgabe.