receipt-ripper.com

Tus recibos nunca salen de tu dispositivo

Todas las guías

Foto vs PDF: qué tipo se analiza mejor

Dos formatos, dos rutas completamente distintas dentro del analizador, dos perfiles de precisión muy diferentes.

4 min de lectura21 de mayo de 2026

La mayoría de los recibos llegan en una de dos formas: un tique impreso que fotografías con el móvil, o un PDF enviado por un comerciante en línea. Los dos formatos parecen similares (ambos son "recibos"), pero dentro de un analizador como Receipt Ripper recorren rutas de código completamente distintas con características de precisión muy diferentes.

Los PDF se dividen en dos campos

Algunos PDFs contienen una capa de texto embebida — los caracteres originales codificados como texto en el archivo. Otros PDFs son básicamente fotografías envueltas en un sobre PDF, sin capa de texto. El primer tipo se analiza casi perfectamente; el segundo no es mejor que una foto.

Puedes distinguirlos abriendo el PDF en cualquier lector e intentando seleccionar texto con el cursor. Si la selección funciona y puedes copiar "Subtotal $12.50" al portapapeles como texto real, es un PDF con capa de texto.

Por qué el OCR de fotos pierde precisión

Un recibo fotografiado tiene razones acumuladas para ser más difícil que un PDF:

  • Distorsión de perspectiva. Fotografiar con ángulo introduce trapecio que la corrección intenta deshacer, pero cada transformación introduce un poco de suavizado.
  • Variación de iluminación. Tu foto probablemente tiene un ligero gradiente — un lado más brillante, el otro más oscuro. El OCR funciona mejor con luminancia uniforme.
  • Calidad de impresión. El papel térmico se descolora; los cartuchos se atascan. Los PDFs generados desde un sistema de facturación no tienen estos problemas.
  • Compresión. Los JPEGs del móvil son fuertemente lossy. Esa compresión se come el detalle fino en el texto más pequeño del recibo.
  • Daño físico. Los recibos del mundo real se arrugan, se doblan, se manchan. Los PDFs no.

Cuándo importa de verdad la diferencia

Para un recibo corto con texto grande — un tique de parquímetro, un café — ambos formatos se analizan bien y la diferencia es académica. Para un recibo largo de restaurante con veinte líneas en letra pequeña al final, la versión PDF es significativamente más precisa.

Para presentar impuestos — donde cada dígito acaba importando — la versión PDF es la que conservar cuando existen ambas. Fotografía el original en papel como respaldo, pero usa el PDF para el análisis si el comerciante lo envió.

Algunos recibos solo existen en un formato

En la práctica, la elección a menudo está hecha por ti. Los tiques solo-papel de tiendas físicas, restaurantes, taxis y parquímetros solo se pueden fotografiar. Los recibos por correo de Amazon, Uber, servicios facturados por Stripe y la mayoría del e-commerce moderno son solo-PDF.

Flujo de trabajo práctico

Para autónomos y pequeñas empresas que reciben una mezcla:

  • Los tiques en papel se fotografían el día que los recibes, mientras la impresión está fresca.
  • Los recibos por correo se guardan como PDF nada más llegar (la mayoría de navegadores tienen "Guardar como PDF" desde el diálogo de imprimir).
  • Todo va a una carpeta (Dropbox, iCloud, OneDrive). La carpeta es tu lote cuando toca pasarlos por Receipt Ripper.
  • Pasa el lote — Receipt Ripper acepta el mezclote incluyendo archivos ZIP — y revisa los resultados.

Para más sobre cómo conseguir que las fotos se analicen limpiamente, ver cómo fotografiar un recibo para que el OCR lo lea.