receipt-ripper.com

Uw bonnen verlaten dit apparaat nooit

Alle gidsen

Foto vs PDF: wat parseert beter

Twee formaten, twee compleet verschillende codepaden in de parser, twee zeer verschillende nauwkeurigheidsprofielen.

4 min leestijd21 mei 2026

De meeste bonnen komen binnen in één van twee vormen: een geprint bonnetje dat je fotografeert met je telefoon, of een PDF die een online winkel per e-mail stuurt. Ze lijken oppervlakkig hetzelfde, maar in een parser zoals Receipt Ripper volgen ze compleet verschillende codepaden.

PDF's splitsen in twee kampen

Sommige PDF's bevatten een ingebedde tekstlaag — de oorspronkelijke karakters gecodeerd als tekst. Andere PDF's zijn in wezen foto's in een PDF-envelop, zonder tekstlaag. De eerste parseren bijna perfect; de tweede zijn niet beter dan een foto.

Je herkent het verschil door de PDF in een reader te openen en tekst te selecteren met de cursor. Werkt de selectie, dan is het een PDF met tekstlaag.

Waarom foto-OCR aan nauwkeurigheid verliest

  • Perspectiefvervorming. Schuin fotograferen introduceert trapeziumvorm die de correctie probeert ongedaan te maken, maar elke transformatie verzacht iets.
  • Belichtingsvariatie. Je foto heeft waarschijnlijk een licht gradient.
  • Drukkwaliteit. Thermisch papier verbleekt; inktlinten raken verstopt. PDF's gegenereerd door een factuursysteem hebben geen van deze problemen.
  • Compressie. Mobiele JPEG's zijn sterk verliesgevend en eten de fijne details van de kleinste tekst op.
  • Fysieke schade. Bonnen uit de echte wereld kreukelen. PDF's niet.

Wanneer het verschil echt uitmaakt

Voor een korte bon met grote tekst — een parkeermeter, een koffie — parseren beide formaten goed. Voor een lange restaurantbon met twintig regels in kleine letters onderaan is de PDF-versie significant nauwkeuriger.

Voor belastingaangifte — waar elk cijfer uiteindelijk telt — is de PDF-versie die je moet bewaren als beide bestaan.

Sommige bonnen bestaan maar in één formaat

In de praktijk wordt de keuze vaak voor je gemaakt. Alleen-papierbonnen van fysieke winkels, restaurants, taxi's en parkeermeters kunnen alleen gefotografeerd worden. E-mailbonnen van Amazon, Uber, door Stripe gefactureerde diensten zijn alleen PDF.

Praktische workflows

  • Papierbonnen worden op de dag van ontvangst gefotografeerd, terwijl de druk vers is.
  • E-mailbonnen worden meteen na binnenkomst opgeslagen als PDF.
  • Alles gaat in één map (Dropbox, iCloud, OneDrive). De map is je batch voor Receipt Ripper.
  • Draai de batch — Receipt Ripper accepteert ook ZIP-archieven.

Voor schone foto's zie hoe je een bon fotografeert.