receipt-ripper.com

Os seus recibos nunca saem do seu dispositivo

Todos os guias

Resolução de problemas de precisão do OCR

O OCR de recibos quebra de poucas maneiras previsíveis. Aqui o diagnóstico.

5 min de leitura21 de maio de 2026

Quando o OCR lê mal um recibo, o primeiro impulso é assumir que o motor de OCR está partido. Na nossa experiência, 90% das más leituras têm uma causa corrigível do lado da entrada — geralmente um problema de foto.

O Receipt Ripper sinaliza os campos de baixa confiança com um badge amarelo — a incerteza honesta do parser.

Os oito padrões comuns

1. Números com substituições de carateres

Especificamente: 8 lido como 3, 0 lido como O ou D, 5 lido como S ou 6, 1 lido como I ou l. Vêm de impressão de baixo contraste. A correção é a montante: melhora a foto.

2. Nome do fornecedor como gibberish

O cabeçalho do recibo é muitas vezes um logo estilizado. O OCR tem dificuldade com tipos de letra não-padrão. Edita o campo na tabela de revisão.

3. Uma linha falta inteira

Comum em recibos térmicos onde uma linha está parcialmente desbotada. O validador sinaliza: soma(totais de linha) ≠ subtotal.

4. A data está errada por um ano ou um mês

As datas de recibos vêm em dezenas de formatos. Quando o recibo é ambíguo (05/04/26), o parser desambigua a partir da língua do recibo.

5. Subtotal, imposto e total não batem certo

O validador verifica se soma(linhas) + imposto + gorjeta ≈ total. Quando falha, olha a foto original e corrige o valor que não bate.

6. A moeda está errada

Um restaurante francês na Suíça pode imprimir CHF, fr., ou deixar implícita. O parser recai para a tua locale.

7. O OCR correu mas o parser não extraiu nada

Acontece com layouts muito incomuns. Preenche os campos manualmente.

8. O processamento falha por completo

Causas comuns: o ficheiro não é realmente imagem ou PDF, o ficheiro é enorme e o dispositivo ficou sem memória, o motor de OCR não carregou.

Um fluxo de diagnóstico

  • Olha a foto primeiro. A maioria das más leituras são problemas de foto.
  • Olha a pista do validador. Diz qual valor não bate.
  • Olha os badges de confiança. Três ou mais amarelos → refazer foto.
  • Refaz ou recorta, não edites campo a campo.
  • Como último recurso, edita manualmente.

O que enviar ao reportar um bug

  • A foto ou PDF do recibo.
  • Descrição curta do que correu mal.
  • O que deveria ter sido o resultado.
  • Opcional: país / língua / comerciante.

Envia para contact@receipt-ripper.com. Cada recibo reportado vira uma fixture de teste interna (dados pessoais ocultados).

Para fotos limpas desde o início, vê como fotografar um recibo.