המרת קבצי PDF - טיפים ל-OCR
טיפים להשגת המרות OCR מעולות
מרשים ככל שיהיה זיהוי תווים אופטי, הוא אינו מושלם ויש לנקוט משנה זהירות כדי לקבל את התוצאות הצפויות. בדומה לעבודת ההכנה המוקדמת הנדרשת להמרת PDF לאקסל, ישנם גם כמה כללים לא כתובים להמרת קבצים סרוקים. להלן תמצאו רשימת בדיקה שימושית שחלה באותה מידה על PDF ל-DOCX ועל PDF ל-XLSX.
כדי לייעל את המסמך שלך למטרות OCR:
התאם ידנית את סיבוב העמוד במידת הצורך . בנוסף להפיכת המסמך הסופי לקל יותר לקריאה, הדבר גם ישפר את דיוק הטקסט שחולץ.
השתמש בתמונות ברזולוציה גבוהה . התמונות צריכות להיות באופן אידיאלי בפורמט PNG וקריאות ללא מאמץ רב מדי של העיניים, אך קבצי JPEG יעבדו באותה מידה. ככל שהתמונה ברורה יותר, כך תוצאת ההמרה טובה יותר.
כלול עיצוב שתואם קרוב לפורמט הפלט (למשל טבלאות הדומות לעיצוב באקסל). זהו כנראה הגורם החשוב ביותר בהבטחת שחזור נאמן של קובץ ה-PDF המקורי שלך ל-DOCX או XLSX.