receipt-ripper.com
Tus recibos nunca salen de tu dispositivo
Dos formatos, dos rutas completamente distintas dentro del analizador, dos perfiles de precisión muy diferentes.
La mayoría de los recibos llegan en una de dos formas: un tique impreso que fotografías con el móvil, o un PDF enviado por un comerciante en línea. Los dos formatos parecen similares (ambos son "recibos"), pero dentro de un analizador como Receipt Ripper recorren rutas de código completamente distintas con características de precisión muy diferentes.
Algunos PDFs contienen una capa de texto embebida — los caracteres originales codificados como texto en el archivo. Otros PDFs son básicamente fotografías envueltas en un sobre PDF, sin capa de texto. El primer tipo se analiza casi perfectamente; el segundo no es mejor que una foto.
Puedes distinguirlos abriendo el PDF en cualquier lector e intentando seleccionar texto con el cursor. Si la selección funciona y puedes copiar "Subtotal $12.50" al portapapeles como texto real, es un PDF con capa de texto.
Un recibo fotografiado tiene razones acumuladas para ser más difícil que un PDF:
Para un recibo corto con texto grande — un tique de parquímetro, un café — ambos formatos se analizan bien y la diferencia es académica. Para un recibo largo de restaurante con veinte líneas en letra pequeña al final, la versión PDF es significativamente más precisa.
Para presentar impuestos — donde cada dígito acaba importando — la versión PDF es la que conservar cuando existen ambas. Fotografía el original en papel como respaldo, pero usa el PDF para el análisis si el comerciante lo envió.
En la práctica, la elección a menudo está hecha por ti. Los tiques solo-papel de tiendas físicas, restaurantes, taxis y parquímetros solo se pueden fotografiar. Los recibos por correo de Amazon, Uber, servicios facturados por Stripe y la mayoría del e-commerce moderno son solo-PDF.
Para autónomos y pequeñas empresas que reciben una mezcla:
Para más sobre cómo conseguir que las fotos se analicen limpiamente, ver cómo fotografiar un recibo para que el OCR lo lea.