In d.velop inbound kann man nun zu Eigenschaften einen Regulären Ausdruck pflegen. Hat man das gemacht, wird dieser Ausdruck während der Analyse der Seiten auf den OCR-Daten des Dokumentes angewendet. Der erste zurückgegebene Wert wird als Eigenschaft zum Dokument gespeichert.

In dieser Diskussion wollen einige Reguläre Ausdrücke zeigen, aber auch weitere von der Community bekommen. Darauf aufbauend werden wir Best-Practice-Ausdrücke im Standard zu der Eigenschaft mit ausliefern. Auch wollen wir hier einige Tipps & Tricks rund um RegEx kommunizieren.

Nun aber ein paar Ausdrücke:

AusdruckBeschreibungmögl. d.velop inbound-Eigenschaft
([0]{1}[1-9]{1}|[1-9]{1}[0-9]{1})[0-9]{3}Ermittelt eine deutsche PLZLieferant (PLZ)
\b((K-\d{5}))\bErmittelt eine alphanumerische Nummer, die mit "K-" anfängtKundennummer
\b((CP-K-\d{5}))\bErmittelt eine alphanumerische Nummer, die mit "CP-K-" anfängtKundennummer
\b((RE-\d{6})(-\d{3})))\bErmittelt eine alphanumerische Nummer, die mit "RE-" anfängt, 6 Ziffern folgen, anschließend ein "-" gefolgt von 3 ZiffernRechnungsnummer
\b((RE-\d{6})(-\d{3}))|((R\d{4})(-\d{4})|((VRG\d{6})))\b

Ermittelt mehrer alphanumerische Nummern. Bsp.:

  • RE-201925-002
  • R2019-1234
  • VRG123456
Rechnungsnummer

Kommentare