receipt-ripper.com

Tus recibos nunca salen de tu dispositivo

Todas las guías

Resolución de problemas de precisión OCR

El OCR de recibos se rompe de un pequeño número de formas predecibles. Aquí el diagnóstico.

5 min de lectura21 de mayo de 2026

Cuando el OCR lee mal un recibo, el primer impulso es asumir que el motor OCR está roto. En nuestra experiencia, el 90% de las malas lecturas tienen una causa arreglable del lado de la entrada — normalmente un problema de foto, a veces un caso límite del formato del proveedor, ocasionalmente un bug del analizador.

Receipt Ripper marca los campos de baja confianza con una insignia amarilla — esa es la "no estoy seguro" honesta del analizador y la forma más rápida de encontrar qué necesita arreglo.

Los ocho patrones comunes de mala lectura

1. Números con sustituciones de caracteres

Específicamente: 8 leído como 3, 0 leído como O o D, 5 leído como S o 6, 1 leído como I o l. Vienen de impresión de bajo contraste (típicamente papel térmico descolorido). El arreglo está aguas arriba: mejora la foto.

2. El nombre del proveedor es galimatías

La cabecera del recibo a menudo es un logotipo estilizado o un nombre en mayúsculas anchas. El OCR lucha con fuentes no estándar. Edita el campo del proveedor en la tabla de revisión.

3. Una línea falta entera

Común en recibos térmicos donde una línea está parcialmente descolorida o donde el espaciado es inusualmente apretado. El validador detecta esto: suma(totales de línea) ≠ subtotal normalmente significa que falta o se duplica una línea.

4. La fecha está mal por un año o un mes

Las fechas de recibos vienen en docenas de formatos. Cuando el recibo es ambiguo (05/04/26), el analizador desambigua a partir del idioma del recibo. A veces se equivoca, especialmente para recibos sin pistas de idioma.

5. Subtotal, impuesto y total no cuadran

El validador comprueba que suma(totales de línea) + impuesto + propina ≈ total dentro de una pequeña tolerancia. Cuando falla, mira la foto original y edita el valor que no cuadra.

6. La divisa está mal

Un restaurante francés en Suiza puede imprimir CHF, fr., SFr, o dejar la divisa implícita. El analizador recurre a tu locale del navegador.

7. El OCR corrió pero el analizador no extrajo nada

Esto sale como: un recibo procesa con éxito, pero los campos están mayormente vacíos. El OCR encontró texto pero el analizador no reconoció el formato. Rellena manualmente.

8. El procesado falla por completo

La tarjeta de sesión muestra "error" en lugar de completarse. Causas comunes: el archivo no es realmente una imagen o PDF, el archivo es enorme y el dispositivo se quedó sin memoria, o el motor OCR falló al cargar.

Un flujo de diagnóstico

  • Mira la foto primero. La mayoría de malas lecturas son problemas de foto.
  • Mira la pista del validador. Te dice qué valor discorda con cuál.
  • Mira las insignias de confianza. Tres o más amarillas → reotma la foto.
  • Retoma o re-recorta, no edites campo a campo.
  • Cuando todo lo demás falla, edita manualmente. Cada campo es editable.

Qué enviar al reportar un bug

  • La foto o PDF del recibo.
  • Una descripción corta de lo que salió mal.
  • Qué debería haber sido el resultado.
  • Opcional: país / idioma / comerciante.

Envíalo a contact@receipt-ripper.com. Cada recibo reportado se convierte en una fixture de prueba interna (con datos personales redactados).

Para conseguir la foto bien desde el principio, ver cómo fotografiar un recibo.