receipt-ripper.com
Le tue ricevute non lasciano mai il tuo dispositivo
L'OCR degli scontrini si rompe in pochi modi prevedibili. Ecco la diagnosi.
Quando l'OCR legge male uno scontrino, il primo impulso è assumere che il motore OCR sia rotto. Nella nostra esperienza, il 90% delle letture errate ha una causa correggibile dal lato input — di solito un problema di foto.
Receipt Ripper segna i campi a bassa confidenza con un badge giallo — l'incertezza onesta del parser.
Specificamente: 8 letto come 3, 0 letto come O o D, 5 letto come S o 6, 1 letto come I o l. Vengono da stampa a basso contrasto. Il fix è a monte: migliora la foto.
L'intestazione dello scontrino è spesso un logo stilizzato. L'OCR fatica con font non standard. Modifica il campo nella tabella di revisione.
Comune su scontrini termici dove una riga è parzialmente sbiadita. Il validatore lo segnala: somma(totali di riga) ≠ subtotale.
Le date di scontrini arrivano in dozzine di formati. Quando lo scontrino è ambiguo (05/04/26), il parser disambigua dalla lingua dello scontrino.
Il validatore controlla che somma(righe) + tassa + mancia ≈ totale. Quando fallisce, guarda la foto originale e correggi il valore sbagliato.
Un ristorante francese in Svizzera può stampare CHF, fr., o lasciare implicita. Il parser ricade sulla tua locale.
Succede con layout molto insoliti. Riempi i campi manualmente.
Cause comuni: il file non è davvero un'immagine o PDF, il file è enorme e il dispositivo è andato fuori memoria, il motore OCR non si è caricato.
Manda a contact@receipt-ripper.com. Ogni scontrino segnalato diventa una fixture di test interna (dati personali oscurati).
Per foto pulite dall'inizio, vedi come fotografare uno scontrino.