receipt-ripper.com
Uw bonnen verlaten dit apparaat nooit
Twee formaten, twee compleet verschillende codepaden in de parser, twee zeer verschillende nauwkeurigheidsprofielen.
De meeste bonnen komen binnen in één van twee vormen: een geprint bonnetje dat je fotografeert met je telefoon, of een PDF die een online winkel per e-mail stuurt. Ze lijken oppervlakkig hetzelfde, maar in een parser zoals Receipt Ripper volgen ze compleet verschillende codepaden.
Sommige PDF's bevatten een ingebedde tekstlaag — de oorspronkelijke karakters gecodeerd als tekst. Andere PDF's zijn in wezen foto's in een PDF-envelop, zonder tekstlaag. De eerste parseren bijna perfect; de tweede zijn niet beter dan een foto.
Je herkent het verschil door de PDF in een reader te openen en tekst te selecteren met de cursor. Werkt de selectie, dan is het een PDF met tekstlaag.
Voor een korte bon met grote tekst — een parkeermeter, een koffie — parseren beide formaten goed. Voor een lange restaurantbon met twintig regels in kleine letters onderaan is de PDF-versie significant nauwkeuriger.
Voor belastingaangifte — waar elk cijfer uiteindelijk telt — is de PDF-versie die je moet bewaren als beide bestaan.
In de praktijk wordt de keuze vaak voor je gemaakt. Alleen-papierbonnen van fysieke winkels, restaurants, taxi's en parkeermeters kunnen alleen gefotografeerd worden. E-mailbonnen van Amazon, Uber, door Stripe gefactureerde diensten zijn alleen PDF.
Voor schone foto's zie hoe je een bon fotografeert.