receipt-ripper.com
Ihre Belege verlassen Ihr Gerät nicht
Zwei Formate, zwei völlig unterschiedliche Codepfade im Parser, zwei sehr unterschiedliche Genauigkeitsprofile.
Belege kommen in einer von zwei Formen: ein Kassenbon, den Sie mit dem Handy fotografieren, oder ein PDF, das ein Online-Händler per E-Mail schickt. Beide sehen oberflächlich ähnlich aus, aber in einem Parser wie Receipt Ripper gehen sie völlig unterschiedliche Code-Wege mit sehr unterschiedlichen Genauigkeitsmerkmalen.
Manche PDFs enthalten eine eingebettete Textebene — die ursprünglichen Zeichen als Text codiert. Andere PDFs sind im Wesentlichen Fotos in einem PDF-Umschlag, ohne Textebene. Erstere parsen nahezu perfekt; letztere sind nicht besser als ein Foto.
Man unterscheidet sie, indem man das PDF in einem Reader öffnet und versucht, Text mit dem Cursor zu markieren. Wenn die Auswahl funktioniert, ist es ein PDF mit Textebene.
Für einen kurzen Beleg mit großem Text — ein Parkschein, ein Kaffee — parsen beide Formate gut. Für einen langen Restaurantbeleg mit zwanzig Positionen in kleiner Schrift unten ist die PDF-Version deutlich genauer.
Für die Steuererklärung — wo jede Ziffer zählt — ist die PDF-Version diejenige, die zu behalten ist, wenn beide existieren.
In der Praxis ist die Wahl oft für Sie getroffen. Reine Papierbelege aus Offline-Läden, Restaurants, Taxis und Parkuhren können nur fotografiert werden. E-Mail-Belege von Amazon, Uber, Stripe-fakturierten Diensten und den meisten modernen E-Commerce-Anbietern sind nur als PDF verfügbar.
Für mehr zu sauberen Fotos siehe Belege fotografieren für OCR.