Se dă un fișier pdf generat de tesseract. Fișier care e uriaș, optimizările promise încă de la versiunea 3.4 nefiind încă implementate. Și se mai dă acces lipsă la Adobe Acrobat pe care îl foloseam pînă de curînd la a optimiza pdf-urile. E drept că Adobe oferă optimizare gratuită online, însă limitează din motive lesne de înțeles mărimea fișierelor ce pot fi uploadate la maximum 500MB. Iar fișierul nostru este, după cum am spus, uriaș. Să zicem 1GB.
Cum fac să îi reduc mărimea dar să păstrez în același timp layer-ul text?
Rezolvare: se instalează Ghostscript și, după ce se declară locația în PATH — lafel ca la problema anterioară, se rulează în linia de comandă:
gswin64c -sDEVICE=pdfwrite -dCompatibilityLevel=1.5 -dPDFSETTINGS=/ebook -dNOPAUSE -dBATCH -dColorImageResolution=150 -sOutputFile=output.pdf FișierUriaș.pdf
Ca exemplu, dintr-un fișier original de 990MB, a rezultat un pdf optimizat de sub 10MB. You welcome.