Version 5.7.4

XPath-Ausdrücke

Was ist XPath?

XPath ist eine Sprache, um durch XML-Bäume zu navigieren und Daten abzufragen. Da die Eingabedaten des Publishers im XML-Format vorliegen, ist XPath das zentrale Werkzeug, um auf Elemente, Attribute und Texte zuzugreifen. Beispiele: »Gib mir alle Artikel mit einem bestimmten Attribut« oder »Wie viele Artikel hat diese Artikelgruppe?«.

Eine allgemeine Einführung in XPath bietet das Tutorial bei W3Schools.

Wo werden XPath-Ausdrücke verwendet?

Der Publisher akzeptiert XPath-Ausdrücke an zwei Stellen:

In den Attributen select und test — hier wird der Wert direkt als XPath interpretiert.
In allen anderen Attributen — durch geschweifte Klammern ({ und }) wird ein XPath-Ausdruck erzwungen.

<Textblock width="{$breite}">
  <Paragraph>
    <Value select="."/>
  </Paragraph>
</Textblock>

Die Breite wird aus der Variable $breite gelesen, der Absatzinhalt ist der Textwert des aktuellen Datenknotens.

Unterstützte Ausdrücke

Zahlen und Text: "5", 'hello world' — werden direkt zurückgegeben.
Rechenoperationen: *, div, idiv, +, -, mod. Beispiel: ( 6 + 4.5 ) * 2
String-Verkettung: || verkettet Zeichenketten. Beispiel: 'Hallo' || ' ' || 'Welt' ergibt Hallo Welt.
Variablen: $spalte + 2
Aktueller Knoten (Punkt-Operator): . + 2
Kindelemente: produktdaten, *, foo/bar, node()
Elternknoten: ../
Attribute: @a, foo/@bar
Filter: article[1] wählt das erste Kindelement article aus.
Vergleiche: <, >, <=, >=, =, !=. Achtung: < muss in XML als < geschrieben werden.
If/then/else: if (...) then ... else ...
For-Ausdrücke: for $i in (1,2,3) return $i * 2 oder for $i in 1 to 3 return $i * 2
Arrays: [1, 2, 3] oder array { 1 to 3 }. Zugriff per Lookup: $arr?2. Siehe Arrays und Maps.
Maps: map { 'name': 'Wert' }. Zugriff per Lookup: $map?name. Siehe Arrays und Maps.
Achsen: preceding-sibling, parent, descendant-or-self, following-sibling usw.

XPath und Namensräume

Der speedata Publisher ignoriert XML-Namensräume in der Voreinstellung. Das ist in der Regel sehr hilfreich, da Namensräume nicht immer leicht zu handhaben sind.

Die XML-Datei:

<bar:data xmlns:bar="somenamespace">
    <bar:child>
        <bar:sub>sub</bar:sub>
    </bar:child>
</bar:data>

kann im Layout wie folgt angesprochen werden:

<Layout xmlns="urn:speedata.de:2009/publisher/en"
    xmlns:sd="urn:speedata:2009/publisher/functions/en">

    <Record element="data">
      ...

obwohl der Namensraum des Wurzelelements somenamespace ist.

Mit <Options namespaces="strict" /> stellt man das um, so dass der Namensraum bei <Record> und bei <ProcessNode> anzugeben ist:

<Layout xmlns="urn:speedata.de:2009/publisher/en"
    xmlns:sd="urn:speedata:2009/publisher/functions/en"
    xmlns:sn="somenamespace">

    <Options namespaces="strict" />

    <Record element="sn:data">
        <PlaceObject>
            <Textblock>
                <Paragraph>
                    <Value select="local-name()"></Value>
                </Paragraph>
            </Textblock>
        </PlaceObject>
    </Record>
</Layout>

Wichtig ist, dass der Namensraum übereinstimmt, der Präfix (hier: sn) ist frei wählbar, solange er mit dem Namensraum verbunden ist.

<ProcessNode> funktioniert ähnlich:

<ProcessNode select="*:child" />
<ProcessNode select="sn:child" />
<ProcessNode select="sn:*" />
<ProcessNode select="*" />

rufen das Kindelement bar:child auf, da die Namensräume von sn (aus dem Layout) und bar (aus den Daten) übereinstimmen. * ist hier eine »Wildcard«, passt also auf alle Namen.

<ProcessNode select="child" /> wird im obigen Fall nicht funktionieren, da der leere Namensraum aus dem Layout urn:speedata.de:2009/publisher/en ist und nicht mit dem Namensraum aus den Daten übereinstimmt.

Ebenfalls muss man in den XPath-Abfragen Namensräume benutzen, wenn sie in den Daten vorgegeben sind:

<Message select="count(sn:sub)" />

schreibt 1 in die Protokolldatei. Ohne Namensraum eine 0, da kein Element sub mit dem voreingestellten Namensraum gefunden wird.

XPath-Ausdrücke

Was ist XPath?

Wo werden XPath-Ausdrücke verwendet?

Unterstützte Ausdrücke

XPath und Namensräume

Inhalt