OCR-Genauigkeit-Troubleshooting

Beleg-OCR bricht in einigen wenigen vorhersagbaren Mustern. Hier die Diagnose.

5 Min. Lesezeit21. Mai 2026

Wenn OCR einen Beleg falsch liest, ist der erste Impuls, anzunehmen, die OCR-Engine sei kaputt. In unserer Erfahrung haben 90% der Falschlesungen eine eingangsseitig behebbare Ursache — meist ein Foto-Problem.

Receipt Ripper markiert Felder mit niedriger Konfidenz mit einem gelben Badge — das ist die ehrliche Unsicherheit des Parsers.

Die acht häufigen Falschlese-Muster

1. Zeichen-Substitutionen in Zahlen

Speziell: 8 als 3 gelesen, 0 als O oder D, 5 als S oder 6, 1 als I oder l. Kommt von kontrastarmem Druck. Der Fix ist upstream: das Foto verbessern.

2. Lieferantenname als Kauderwelsch

Die Kopfzeile ist oft ein stilisiertes Logo. OCR kämpft mit Nicht-Standardschriften. Das Feld direkt in der Prüf-Tabelle editieren.

3. Eine ganze Zeile fehlt

Häufig bei Thermo-Belegen mit teils verblasstem Druck. Der Validator markiert: summe(zeilensummen) ≠ zwischensumme bedeutet meist eine fehlende oder doppelte Zeile.

4. Datum um ein Jahr oder einen Monat falsch

Belegdaten kommen in Dutzenden Formaten. Bei mehrdeutigen Daten desambiguiert der Parser anhand der Belegsprache. Manchmal liegt er daneben.

5. Zwischensumme, Steuer, Summe gleichen sich nicht ab

Der Validator prüft summe(zeilen) + steuer + trinkgeld ≈ gesamt. Bei Fehlschlag das Originalfoto anschauen und den nicht passenden Wert korrigieren.

6. Währung falsch

Ein französisches Restaurant in der Schweiz druckt CHF, fr., SFr oder lässt die Währung implizit. Der Parser fällt auf Ihre Browser-Locale zurück.

7. OCR lief, aber Parser extrahierte nichts

Passiert bei sehr ungewöhnlichen Layouts. Felder manuell ausfüllen.

8. Verarbeitung schlägt ganz fehl

Häufige Ursachen: Datei ist kein Bild oder PDF, Datei ist riesig und der Gerätearbeitsspeicher ist voll, OCR-Engine konnte nicht laden.

Ein Diagnose-Workflow

Erst das Foto anschauen. Die meisten Falschlesungen sind Foto-Probleme.
Den Validator-Hinweis anschauen. Er sagt, welcher Wert nicht passt.
Konfidenz-Badges anschauen. Drei oder mehr gelbe → Foto neu machen.
Neu fotografieren oder neu zuschneiden statt feldweise korrigieren.
Als letzte Option manuell editieren.

Was beim Bug-Report senden

Das Foto oder PDF des Belegs.
Eine kurze Beschreibung, was der Parser falsch gemacht hat.
Was das Ergebnis hätte sein sollen.
Optional: Land / Sprache / Händler.

Senden an contact@receipt-ripper.com. Jeder gemeldete Beleg wird zu einer internen Test-Fixture.

Für saubere Fotos von Anfang an siehe Belege fotografieren.