receipt-ripper.com
Os seus recibos nunca saem do seu dispositivo
O OCR de recibos quebra de poucas maneiras previsíveis. Aqui o diagnóstico.
Quando o OCR lê mal um recibo, o primeiro impulso é assumir que o motor de OCR está partido. Na nossa experiência, 90% das más leituras têm uma causa corrigível do lado da entrada — geralmente um problema de foto.
O Receipt Ripper sinaliza os campos de baixa confiança com um badge amarelo — a incerteza honesta do parser.
Especificamente: 8 lido como 3, 0 lido como O ou D, 5 lido como S ou 6, 1 lido como I ou l. Vêm de impressão de baixo contraste. A correção é a montante: melhora a foto.
O cabeçalho do recibo é muitas vezes um logo estilizado. O OCR tem dificuldade com tipos de letra não-padrão. Edita o campo na tabela de revisão.
Comum em recibos térmicos onde uma linha está parcialmente desbotada. O validador sinaliza: soma(totais de linha) ≠ subtotal.
As datas de recibos vêm em dezenas de formatos. Quando o recibo é ambíguo (05/04/26), o parser desambigua a partir da língua do recibo.
O validador verifica se soma(linhas) + imposto + gorjeta ≈ total. Quando falha, olha a foto original e corrige o valor que não bate.
Um restaurante francês na Suíça pode imprimir CHF, fr., ou deixar implícita. O parser recai para a tua locale.
Acontece com layouts muito incomuns. Preenche os campos manualmente.
Causas comuns: o ficheiro não é realmente imagem ou PDF, o ficheiro é enorme e o dispositivo ficou sem memória, o motor de OCR não carregou.
Envia para contact@receipt-ripper.com. Cada recibo reportado vira uma fixture de teste interna (dados pessoais ocultados).
Para fotos limpas desde o início, vê como fotografar um recibo.