receipt-ripper.com
Tus recibos nunca salen de tu dispositivo
El OCR de recibos se rompe de un pequeño número de formas predecibles. Aquí el diagnóstico.
Cuando el OCR lee mal un recibo, el primer impulso es asumir que el motor OCR está roto. En nuestra experiencia, el 90% de las malas lecturas tienen una causa arreglable del lado de la entrada — normalmente un problema de foto, a veces un caso límite del formato del proveedor, ocasionalmente un bug del analizador.
Receipt Ripper marca los campos de baja confianza con una insignia amarilla — esa es la "no estoy seguro" honesta del analizador y la forma más rápida de encontrar qué necesita arreglo.
Específicamente: 8 leído como 3, 0 leído como O o D, 5 leído como S o 6, 1 leído como I o l. Vienen de impresión de bajo contraste (típicamente papel térmico descolorido). El arreglo está aguas arriba: mejora la foto.
La cabecera del recibo a menudo es un logotipo estilizado o un nombre en mayúsculas anchas. El OCR lucha con fuentes no estándar. Edita el campo del proveedor en la tabla de revisión.
Común en recibos térmicos donde una línea está parcialmente descolorida o donde el espaciado es inusualmente apretado. El validador detecta esto: suma(totales de línea) ≠ subtotal normalmente significa que falta o se duplica una línea.
Las fechas de recibos vienen en docenas de formatos. Cuando el recibo es ambiguo (05/04/26), el analizador desambigua a partir del idioma del recibo. A veces se equivoca, especialmente para recibos sin pistas de idioma.
El validador comprueba que suma(totales de línea) + impuesto + propina ≈ total dentro de una pequeña tolerancia. Cuando falla, mira la foto original y edita el valor que no cuadra.
Un restaurante francés en Suiza puede imprimir CHF, fr., SFr, o dejar la divisa implícita. El analizador recurre a tu locale del navegador.
Esto sale como: un recibo procesa con éxito, pero los campos están mayormente vacíos. El OCR encontró texto pero el analizador no reconoció el formato. Rellena manualmente.
La tarjeta de sesión muestra "error" en lugar de completarse. Causas comunes: el archivo no es realmente una imagen o PDF, el archivo es enorme y el dispositivo se quedó sin memoria, o el motor OCR falló al cargar.
Envíalo a contact@receipt-ripper.com. Cada recibo reportado se convierte en una fixture de prueba interna (con datos personales redactados).
Para conseguir la foto bien desde el principio, ver cómo fotografiar un recibo.