In d.velop inbound kann man nun zu Eigenschaften einen Regulären Ausdruck pflegen. Hat man das gemacht, wird dieser Ausdruck während der Analyse der Seiten auf den OCR-Daten des Dokumentes angewendet. Der erste zurückgegebene Wert wird als Eigenschaft zum Dokument gespeichert.

In dieser Diskussion wollen wir einige Reguläre Ausdrücke zeigen, aber auch weitere von der Community bekommen. Darauf aufbauend werden wir Best-Practice-Ausdrücke im Standard zu der Eigenschaft mit ausliefern. Auch wollen wir hier einige Tipps & Tricks rund um RegEx kommunizieren.

Nun aber ein paar Ausdrücke:

AusdruckBeschreibungmögl. d.velop inbound-Eigenschaft
([0]{1}[1-9]{1}|[1-9]{1}[0-9]{1})[0-9]{3}Ermittelt eine deutsche PLZLieferant (PLZ)
\b((K-\d{5}))\bErmittelt eine alphanumerische Nummer, die mit "K-" anfängtKundennummer
\b((CP-K-\d{5}))\bErmittelt eine alphanumerische Nummer, die mit "CP-K-" anfängtKundennummer
\b((RE-\d{6})(-\d{3})))\bErmittelt eine alphanumerische Nummer, die mit "RE-" anfängt, 6 Ziffern folgen, anschließend ein "-" gefolgt von 3 ZiffernRechnungsnummer
\b((RE-\d{6})(-\d{3}))|((R\d{4})(-\d{4})|((VRG\d{6})))\b

Ermittelt mehrer alphanumerische Nummern. Bsp.:

  • RE-201925-002
  • R2019-1234
  • VRG123456
Rechnungsnummer
((1|2)\d{4,5})Gibt eine 4- oder 5-stellige Nummer zurück, die mit 1 oder 2 beginntdiv.
(?<=LEASINGVERTRAG )((8|9)\d{5,6})

Ermittelt eine 6- oder 7-stellige Vertragsnummer, die mit 8 oder 9 beginnt. Diese aber nur wenn vor der Nummer "LEASINGVERTRAG " (mit Leerzeichen) steht.

Bsp.:

Gibt "8123548" zurück, wenn im Textinhalt "... LEASINGVERTRAG 8123548 ..." vorkommt. Gibt nichts zurück, wenn im Textinhalt "... Vertrag 8123548 ..." vorkommt. 

Vertragsnummer
(?<=Re-Nr. |Rechnungsnummer |RechNr: )(\d{7,8})

Ermittelt eine 7- oder 8-stellige Nummer. Diese aber nur wenn vor der Nummer "Re-Nr. ", "Rechnungsnummer " oder "RechNr: " (jeweils mit Leerzeichen) steht.

Bsp.:

Gibt "2020126" zurück, wenn im Textinhalt "... Rechnungsnummer 2020126 ..." vorkommt. Gibt nichts zurück, wenn im Textinhalt eine passende Nummer ohne den Teilstrings davor vorkommt. 

Rechnungsnummer
[A-ZÖÜÄ]{1,3} [A-ZÖÜÄ]{1,2} [1-9]{1}[0-9]{1,3}

Gibt ein deutsches KFZ-Kennzeichen (ohne Bindestriche) zurück


Bsp.: 
Gibt BOR DV 125 zurück, aber nicht BOR-DV 254

KFZ-Kennzeichen

Kommentare