PDF's converteren - OCR-tips
Tips voor het behalen van geweldige OCR-conversies
Hoe indrukwekkend Optical Character Recognition (OCR) ook is, het is niet perfect en vereist enige zorgvuldigheid om de resultaten te krijgen die u verwacht. Net als de voorbereidende werkzaamheden die nodig zijn om uw PDF naar Excel te converteren, gelden er ook een paar ongeschreven regels voor het converteren van gescande bestanden. Hieronder vindt u een handige checklist die even goed van toepassing is op PDF naar DOCX als op PDF naar XLSX.
Om uw document te optimaliseren voor OCR-doeleinden:
Pas de paginarotatie handmatig aan waar nodig. Dit maakt het uiteindelijke document niet alleen leesbaarder, maar verbetert ook de nauwkeurigheid van de geëxtraheerde tekst.
Gebruik afbeeldingen met een hoge resolutie. De afbeeldingen zouden idealiter in PNG-formaat moeten zijn en leesbaar moeten zijn zonder al te veel vermoeide ogen, maar JPEG's werken net zo goed. Hoe duidelijker het beeld, hoe beter het conversieresultaat.
Voeg opmaak toe die nauw aansluit bij het uitvoerformaat (bijv. tabellen die lijken op de opmaak in Excel). Dit is waarschijnlijk de grootste factor om ervoor te zorgen dat uw originele PDF getrouw wordt weergegeven in DOCX of XLSX.