Foto vs PDF: Was parst besser

Zwei Formate, zwei völlig unterschiedliche Codepfade im Parser, zwei sehr unterschiedliche Genauigkeitsprofile.

4 Min. Lesezeit21. Mai 2026

Belege kommen in einer von zwei Formen: ein Kassenbon, den Sie mit dem Handy fotografieren, oder ein PDF, das ein Online-Händler per E-Mail schickt. Beide sehen oberflächlich ähnlich aus, aber in einem Parser wie Receipt Ripper gehen sie völlig unterschiedliche Code-Wege mit sehr unterschiedlichen Genauigkeitsmerkmalen.

PDFs zerfallen in zwei Lager

Manche PDFs enthalten eine eingebettete Textebene — die ursprünglichen Zeichen als Text codiert. Andere PDFs sind im Wesentlichen Fotos in einem PDF-Umschlag, ohne Textebene. Erstere parsen nahezu perfekt; letztere sind nicht besser als ein Foto.

Man unterscheidet sie, indem man das PDF in einem Reader öffnet und versucht, Text mit dem Cursor zu markieren. Wenn die Auswahl funktioniert, ist es ein PDF mit Textebene.

Warum Foto-OCR an Genauigkeit verliert

Perspektivverzerrung. Schräges Fotografieren erzeugt Trapez. Jede Transformation weicht das Bild leicht auf.
Beleuchtungsvariation. Ihr Foto hat wahrscheinlich einen leichten Gradient.
Druckqualität. Thermopapier verblasst; Farbbänder verstopfen. Aus einem Abrechnungssystem generierte PDFs haben keines dieser Probleme.
Kompression. Handy-JPEGs sind stark verlustbehaftet und fressen feine Details kleiner Texte.
Physische Schäden. Belege werden zerknittert. PDFs nicht.

Wann die Differenz wirklich zählt

Für einen kurzen Beleg mit großem Text — ein Parkschein, ein Kaffee — parsen beide Formate gut. Für einen langen Restaurantbeleg mit zwanzig Positionen in kleiner Schrift unten ist die PDF-Version deutlich genauer.

Für die Steuererklärung — wo jede Ziffer zählt — ist die PDF-Version diejenige, die zu behalten ist, wenn beide existieren.

Manche Belege gibt es nur in einem Format

In der Praxis ist die Wahl oft für Sie getroffen. Reine Papierbelege aus Offline-Läden, Restaurants, Taxis und Parkuhren können nur fotografiert werden. E-Mail-Belege von Amazon, Uber, Stripe-fakturierten Diensten und den meisten modernen E-Commerce-Anbietern sind nur als PDF verfügbar.

Praktische Workflows

Papierbelege werden am Empfangstag fotografiert, solange der Druck frisch ist.
E-Mail-Belege werden sofort beim Eingang als PDF gespeichert.
Alles geht in einen Ordner (Dropbox, iCloud, OneDrive). Der Ordner ist Ihr Batch für Receipt Ripper.
Den Batch laufen lassen — Receipt Ripper akzeptiert auch ZIP-Archive.

Für mehr zu sauberen Fotos siehe Belege fotografieren für OCR.

PDFs zerfallen in zwei Lager

Warum Foto-OCR an Genauigkeit verliert

Wann die Differenz wirklich zählt

Manche Belege gibt es nur in einem Format

Praktische Workflows

Verwandte Leitfäden

Wie Sie einen Beleg fotografieren, damit OCR ihn richtig liest

OCR-Genauigkeit-Troubleshooting — wenn das Beleg-OCR daneben liegt, wie es behoben wird