receipt-ripper.com
Vos reçus ne quittent jamais votre appareil
La photographie est la moitié injuste de la précision de l'OCR. Faites-le bien et l'analyseur fait son travail. Mal et vous passez les dix minutes suivantes à taper.
L'OCR de reçus échoue pour deux raisons. Soit le moteur ne peut pas lire ce qui est là, soit ce qui est là n'est pas lisible (un problème de photo que vous pouvez régler en dix secondes si vous savez quoi régler). Ce guide traite du second.
Receipt Ripper applique correction de perspective et réduction d'échelle automatiques avant même que l'OCR ne tourne, donc le seuil n'est pas "qualité studio" — c'est "le moteur OCR peut distinguer les chiffres sans ambiguïté".
La variable la plus importante est l'éclairage. Un reçu thermique a très peu de contraste — encre noire sur papier blanchâtre. Votre travail : le mettre dans le bon bout du spectre.
En intérieur, le plus simple : une fenêtre en journée, vous entre la fenêtre et le reçu. Lumière vive, uniforme, diffuse. Pas de reflet sur le reçu — les reflets crament l'encre et l'OCR voit du papier blanc.
Blanc sur blanc tue le détecteur de bords. La phase de correction trouve les bords du papier en cherchant des changements brusques de luminance. Un reçu blanc sur un plan de travail blanc n'a pas de changement à la frontière.
Utilisez une surface sombre et mate : table en bois foncé, set de table charbon, couverture de livre noir. Les surfaces brillantes (granit, marbre poli, verre) reflètent la lumière et créent un halo.
La correction de perspective gère pas mal — jusqu'à environ 40° d'inclinaison — mais ce n'est pas gratuit. Chaque étape de correction adoucit légèrement l'image. Les meilleurs résultats viennent de photos où le téléphone est à peu près parallèle au reçu et centré dessus.
Vous voulez que le reçu soit aussi grand que possible dans le cadre sans toucher les bords. Plus grand : plus de pixels pour l'OCR. Sans toucher les bords : le détecteur de coins a besoin de pixels non-reçu autour pour trouver la frontière.
Une bordure d'environ 10% de l'axe long fonctionne bien.
Les caméras frontales font 5-7 MP sur la plupart des appareils ; les arrières 12 MP ou plus. Pour l'OCR, la résolution supplémentaire de la caméra arrière vaut plus que le confort du viseur.
N'utilisez pas le mode "Live Photos" d'iOS. N'utilisez pas de scanners de documents tiers qui binarisent l'image en noir et blanc — ils jettent les données en niveaux de gris qui aident l'OCR à distinguer 8 et 3.
Le flash est à pile ou face. Sur reçus délavés où l'encre est à peine visible, le flash peut récupérer assez de contraste. Sur reçus frais, le flash lessive l'impression et crée un point de brillance au milieu — souvent juste sur le total.
Règle : essayez sans flash d'abord. Si le résultat est délavé ou flou en lumière basse, retentez avec.
Après avoir déposé la photo dans Receipt Ripper, le tableau de relecture affiche chaque champ avec un indicateur de confiance. Les badges jaunes sont l'incertitude honnête de l'analyseur — un indice gratuit que quelque chose ne s'est pas lu proprement.
Un reçu qui ne se lit pas malgré une bonne photo ? Envoyez-le-nous — chaque reçu problématique apprend quelque chose au parseur.