De logica achter factuurherkenning met OCR software

COMAX Factuurherkenning met OCR software

Als leverancier van een factuurherkenningsoplossing krijgen wij dikwijls de vraag van onze klanten wat de logica achter de herkenning is. Wat maakt dat een factuur goed herkend kan worden? In een ideale situatie leveren de meeste leveranciers meteen vanuit hun facturatieprogramma een UBL aan naast de PDF factuur. Zo kan deze meteen digitaal verwerkt worden en zijn er geen extra handelingen meer nodig. Aangezien we nog niet zo ver zijn, is een goede factuurherkenning van groot belang.

Wat is nu juist factuurherkenning met OCR software en hoe zit deze logica in elkaar?

Wat is factuurherkenning met OCR software

Om een PDF factuur om te zetten naar UBL, wordt er gebruikt gemaakt van OCR software. OCR, Optical Character Recognition of in het Nederlands optische tekenherkenning, staat voor een techniek waarbij uit een afbeelding of PDF, door middel van patroonherkenning, alle tekens worden uitgehaald.

Voor factuurherkenning wordt dus de lay-out van de PDF factuur gelezen en worden zo de gegevens daaruit omgezet naar tekst voor verdere verwerking naar een UBL. Het spreekt voor zich: hoe logischer de opbouw van de lay-out van deze factuur, hoe waardevoller de herkenning. En daar wringt nu net het schoentje. Er is geen rechtlijnigheid in hoe een factuur opgebouwd is.

De lay-out van de factuur heeft u zelf in de hand

Hier meteen de eerste logica: hoe kwalitatiever de opbouw en gegevens van de PDF factuur, hoe waardevoller de factuurherkenning. Mits kleine aanpassingen aan de lay-out van de factuur, kan u er zelf voor zorgen dat er een hogere herkenning mogelijk is. Zo verloopt de automatische omzetting naar UBL vlotter en verminderen de manuele handelingen die nodig zijn voor verdere verwerking.

Kort gezegd, los de problemen op aan het begin van de ketting. Dit zorgt voor minder problemen en minder werk op het einde van de ketting.

De logica achter factuurherkenning

We geven graag enkele feiten mee waarop factuurherkenning zich baseert. Zo kunnen kleine aanpassingen aan de lay-out van uw facturen een groot verschil maken.

Wat wordt  er meestal 100% herkend

Ondernemingsnummers van klanten en leveranciers en ook OGM nummers worden meestal 100% herkend door de OCR software. Dit omdat deze duidelijk controleerbare gegevens zijn met een checksum.

Kolom en rij – logica

Gegevens worden aan elkaar gerelateerd in kolommen of rijen. Staat bijvoorbeeld het factuurnummer dus niet achter of onder de verwijzing “factuurnummer / documentnummer” dan is dit moeilijker of niet herkenbaar.

De effectieve afbakening van rij- en kolomgegevens met lijnen verbetert bovendien de herkenning ook nog.

BTW percentage

Voor de BTW voet gaat de factuurherkenning op zoek naar een bedrag waar een percentage-teken achter staat. Het percentage-teken er niet bij vermelden of voor het bedrag plaatsen, geeft een moeilijkere herkenning.

Indien er geen percentage-tekens vermeld staan, stelt de software als standaard 21% voor omdat deze BTW voet het meeste voorkomt.

Voorbeeld factuur 1

Ook is het van groot belang dat enkel het BTW percentage vermeld staat dat effectief van toepassing is. We zien heel vaak dat de andere BTW percentages eveneens vermeld staan, ook al zijn ze niet van toepassing. Vermeld enkel het BTW percentage dat effectief berekend wordt. De andere laat u best achterwege. Zo kan de OCR software er met meer zekerheid het juiste BTW percentage uit herkennen.

Voorbeeld factuur 2

Header velden

Zet het header veld steeds boven het gegeven. Staat deze eronder dan kan dit niet of moeilijker uitgelezen worden. In het voorbeeld hieronder is dit van toepassing op het ‘Te betalen’ veld.  Deze staat onder het dataveld en wordt dus niet of moeilijk uitgelezen.

Voorbeeld factuur 3

Ondernemingsnummer

Hoewel we hierboven reeds vermeld hebben dat een ondernemingsnummer steeds herkend kan worden, is het toch belangrijk dat deze heel duidelijk vermeld wordt op de factuur. Dikwijls staat deze ergens onderaan in de voetnoot of heel klein vermeld waardoor deze toch niet herkend kan worden. Vermeld steeds duidelijk en leesbaar uw ondernemingsnummer en dat van uw klant op de factuur. Doe dit op een normale tekstgrootte en op een duidelijke plaats. Eventueel kan deze mee opgenomen worden bovenaan bij het logo of de factuurgegevens.

Algemeen

We geven graag nog een paar kleine weetjes mee waar ook gemakkelijk rekening mee gehouden kan worden in de lay-out van de PDF factuur.

In afwachting van de ideale situatie waarbij elke PDF factuur gekoppeld is aan een UBL factuur, is herkenningssoftware een goed, tijdelijk alternatief om tijd te doen besparen.

Maar maak het uzelf hierin gemakkelijk. Verhoog het percentage van factuurherkenning door deze kleine en eenvoudige aanpassingen door te voeren in de lay-out van uw eigen facturen of door deze tips mee te geven aan uw klanten en leveranciers. Dit is een kleine moeite die de kwaliteit van de automatische factuurherkenning onmiddellijk verhoogt. Hierdoor verminderen uw manuele handelingen aanzienlijk en bijgevolg verhoogt uw productiviteit.

Voor de rest laat u het maar aan COMAX over. Wij zorgen ervoor dat er van elke factuur automatisch een UBL bestand gecreëerd wordt dat in elk boekhoudpakket ingelezen kan worden. Wist u trouwens dat onze module COMAX ocr & search zorgt voor een volledige tekstherkenning op heel uw digitaal archief? Dit samen met een uitgebreide zoekmotor verliest u nooit meer cruciale informatie. Meer informatie hierover vindt u hier.

Contacteer ons gerust voor bijkomende vragen of advies.

21 augustus 2019 [addtoany]