Conversão de PDFs - Dicas de OCR
Dicas para obter ótimas conversões de OCR
Por mais impressionante que o Reconhecimento Óptico de Caracteres seja, ele não é perfeito e é preciso ter alguns cuidados para obter os resultados esperados. Assim como o trabalho preparatório inicial necessário para converter seu PDF para Excel, também existem algumas regras não escritas para converter arquivos digitalizados. Abaixo, você encontrará uma lista de verificação útil que se aplica igualmente bem a PDF para DOCX e PDF para XLSX.
Para otimizar seu documento para fins de OCR:
Ajuste manualmente a rotação da página quando necessário . Além de facilitar a leitura do documento final, isso também aumentará a precisão do texto extraído.
Use imagens de alta resolução . O ideal é que as imagens estejam no formato PNG e sejam legíveis sem forçar muito a vista, mas JPEGs também funcionam bem. Quanto mais nítida a imagem, melhor o resultado da conversão.
Inclua uma formatação que corresponda ao formato de saída (por exemplo, tabelas que se assemelham à formatação do Excel). Este é provavelmente o fator mais importante para garantir a recriação fiel do seu PDF original em DOCX ou XLSX.