receipt-ripper.com
Le tue ricevute non lasciano mai il tuo dispositivo
La fotografia è la metà ingiusta della precisione OCR. Fallo bene e il parser fa il suo lavoro. Fallo male e passi i prossimi dieci minuti a battere a macchina.
L'OCR degli scontrini fallisce per due motivi. O il motore non può leggere quello che c'è, o quello che c'è non è leggibile (un problema fotografico che puoi risolvere in dieci secondi se sai cosa risolvere). Questa guida tratta del secondo.
Receipt Ripper applica correzione prospettica e riduzione di scala automatiche prima ancora che l'OCR giri, quindi la soglia non è "qualità da studio" — è "il motore OCR può distinguere cifre senza ambiguità".
La variabile più importante è l'illuminazione. Uno scontrino termico ha pochissimo contrasto — inchiostro nero su carta biancastra. Il tuo compito: metterlo nella zona facile dello spettro.
In interno il modo più facile: una finestra di giorno, tu tra finestra e scontrino. Luce viva, uniforme, diffusa. Niente riflessi sullo scontrino — i riflessi bruciano l'inchiostro e l'OCR vede carta bianca.
Bianco su bianco ammazza il rilevatore di bordi. La fase di correzione trova i bordi della carta cercando cambi bruschi di luminanza. Uno scontrino bianco su un piano bianco non ha cambio al bordo.
Usa una superficie scura e opaca. Tavolo di legno scuro, tovaglietta antracite, copertina di un libro nero. Le superfici lucide (granito, marmo lucido, vetro) riflettono la luce e creano un alone.
La correzione prospettica gestisce parecchio — fino a circa 40° di inclinazione — ma non è gratis. Ogni passo di correzione ammorbidisce leggermente l'immagine. I migliori risultati vengono da foto in cui il telefono è all'incirca parallelo allo scontrino e centrato sopra.
Vuoi che lo scontrino sia più grande possibile nell'inquadratura senza toccare i bordi. Più grande: più pixel per l'OCR. Senza toccare i bordi: il rilevatore di angoli ha bisogno di pixel non-scontrino intorno per trovare il confine.
Un bordo di circa il 10% dell'asse lungo funziona bene.
Le fotocamere frontali hanno 5-7 MP sulla maggior parte dei dispositivi; le posteriori 12 MP o più. Per l'OCR, la risoluzione extra della fotocamera posteriore vale più della comodità del viewfinder.
Non usare la modalità "Live Photos" di iOS. Non usare scanner di documenti di terze parti che binarizzano l'immagine in bianco e nero — buttano via i dati a scala di grigi che aiutano l'OCR a distinguere 8 da 3.
Il flash è testa o croce. Su scontrini sbiaditi può recuperare contrasto. Su scontrini freschi brucia la stampa e crea un riflesso al centro, spesso proprio sul totale.
Regola pratica: prova senza flash prima. Se il risultato è sbiadito o sfocato con poca luce, riprova col flash.
Dopo aver fatto cadere la foto in Receipt Ripper, la tabella di revisione mostra ogni campo con un indicatore di confidenza. I badge gialli sono l'incertezza onesta del parser — un suggerimento gratis che qualcosa non è stato letto pulitamente.
Uno scontrino che continua a sbagliare nonostante una buona foto? Mandacelo — ogni scontrino problematico insegna qualcosa di nuovo al parser.