Conversión de archivos PDF - Consejos de OCR
Consejos para obtener excelentes conversiones de OCR
A pesar de lo impresionante que es el reconocimiento óptico de caracteres, no es perfecto y se debe tener cuidado para obtener los resultados que espera. De manera similar al trabajo de preparación inicial necesario para convertir su PDF a Excel, también hay algunas reglas no escritas para convertir archivos escaneados. A continuación, encontrará una práctica lista de verificación que se aplica igualmente bien a PDF a DOCX y PDF a XLSX.
Para optimizar su documento a efectos de OCR:
Ajuste manualmente la rotación de la página cuando sea necesario. Además de facilitar la lectura del documento final, esto también mejorará la precisión del texto extraído.
Usar imágenes de alta resolución. Lo ideal es que las imágenes estén en formato PNG y sean legibles sin demasiada fatiga visual, pero los archivos JPEG funcionan igual de bien. Cuanto más clara sea la imagen, mejor será el resultado de la conversión.
Incluir un formato que coincida estrechamente con el formato de salida (por ejemplo, tablas que se asemejan al formato de Excel). Este es probablemente el factor más importante para garantizar la recreación fiel de su PDF original en DOCX o XLSX.