Конвертиране на PDF файлове - съвети за OCR
Съвети за постигане на отлични OCR конверсии
Колкото и впечатляващо да е оптичното разпознаване на символи, то не е перфектно и е необходимо да се внимава, за да се получат очакваните резултати. Подобно на предварителната подготовка, необходима за конвертиране на PDF в Excel, има и няколко неписани правила за конвертиране на сканирани файлове. По-долу ще намерите удобен контролен списък, който се отнася еднакво добре както за PDF в DOCX, така и за PDF в XLSX.
За да оптимизирате документа си за целите на OCR:
Регулирайте ръчно завъртането на страницата, където е необходимо . Освен че ще направи крайния документ по-лесен за четене, това ще подобри и точността на извлечения текст.
Използвайте изображения с висока резолюция . В идеалния случай изображенията трябва да са във формат PNG и да се четат без прекалено много напрежение на очите, но JPEG файловете работят също толкова добре. Колкото по-ясно е изображението, толкова по-добър е резултатът от конвертирането.
Включете форматиране, което съответства точно на изходния формат (напр. таблици, които наподобяват форматирането в Excel). Това е може би най-важният фактор за осигуряване на вярно пресъздаване на оригиналния PDF файл в DOCX или XLSX.