In principe is het pdf-formaat niet bedoeld om verder te bewerken. Meestal gebruik je een pdf export vanuit je tekstverwerker of opmaakprogramma om er zeker van te zijn dat jouw document er op een ander scherm exact hetzelfde uitziet. Toch is het soms handig om kleine foutjes in pdf-documenten te (kunnen) herstellen. Wij hebben drie programma getest met uiteenlopende mogelijkheden: PDF Mod, PDFsam en PDF Chain.

Je vraagt je misschien af waarom je pdf-bestanden zou willen bewerken, als je net zo goed het bronbestand in pakweg LibreOffice kunt bewerken? Zelf komen wij geregeld in situaties terecht waarin het handig is om een pdf-document te bewerken. Denk bijvoorbeeld aan een ellenlang en behoorlijk groot pdf-bestand waarvan je het bronbestand niet hebt. Wil je enkele pagina’s daaruit e-mailen naar een vriend of collega, dan is het handig als je de relevante pagina’s eruit kunt halen. Pdf is ook een populair formaat om scans van documenten met meerdere pagina’s te bewaren. Voor Linux is er bijvoorbeeld het prima gscan2pdf om documenten te digitaliseren. Daarin scan, roteer en herschik je pagina’s naar hartenlust voordat je het bestand naar pdf exporteert. Maar wat als je achteraf merkt dat een pagina ontbreekt, iets verkeerd geroteerd is of tweemaal gescand? Dan heb je een pdf editor nodig om die fouten recht te zetten. Wij hebben drie tools getest die in meeste Linux-distributies beschikbaar zijn.

 

PDF Mod

We beginnen met PDF Mod, een eenvoudig programma dat de meest essentiële pdf-bewerkingen aanbiedt. Het programma is gebaseerd op Mono, net zoals bijvoorbeeld Banshee of Tomboy. Niet iedereen is fan van die technologie, dus we vermelden dit toch even. PDF Mod toont thumbnails van alle pagina’s in het geopende pdf-bestand. Je kunt daarop in- of uitzoomen via de schuifbalk rechtsonder of door te scrollen met het muiswiel terwijl je de Control-toets ingedrukt houdt. Je selecteert één of meerdere pagina’s door erop te klikken met de Shift- of Control-toets ingedrukt, net zoals bijvoorbeeld in je bestandsbeheerder. In het Edit-menu vind je opties om snel alle even of oneven pagina’s te selecteren of alle pagina’s waarin een bepaalde zoekterm voorkomt.

Via het Edit-menu (of een rechtermuisklik op een geselecteerde pagina) krijg je de verschillende bewerkingen te zien: pagina’s verwijderen of extraheren (waarmee je een nieuw document maakt met enkel de geselecteerde pagina’s) of linksom of rechtsom roteren. Pagina’s herschikken doe je gewoon door ze te verslepen naar de gewenste positie. Via de Insert From-functie voeg je alle pagina’s uit een tweede pdf-document in. Verder kan je bladwijzers bewerken en alle afbeeldingen van de geselecteerde pagina(‘s) exporteren naar individuele png-bestanden. Die laatste functie bleek echter niet te werken tijdens onze test: PDF Mod crashte steevast met een segmentation fault. Tot slot laat PDF Mod je ook enkele algemene documenteigenschappen instellen, zoals titel, auteur en trefwoorden. Ook konden we één van onze testdocumenten niet openen in PDF Mod. Het gaat om een 280 pagina’s tellende pdf met veel bookmarks, verwijzingen en voetnoten dat in LaTeX gemaakt is.

 

PDFsam

Oorspronkelijk is PDFsam ontwikkeld om pdf-bestanden te splitsen of samen te voegen (Split And Merge, vandaar de naam). Intussen bevat het programma ook extra modules om pagina’s te extraheren en te roteren. PDFsam vind je terug in de repository van bijvoorbeeld Ubuntu en Linux Mint, maar dat is een erg oude versie met enkel de split en merge-functies. De laatste versie download je vanaf http://www.pdfsam.org/download-pdfsam-basic. De installatie vereist wel minstens versie 1.8 van de Java Runtime Environment (pakket openjdk-8-jre in Ubuntu/Linux Mint). Hoewel PDFsam open source is, bestaat ook een betaalde versie met geavanceerde mogelijkheden (PDFsam Enhanced). Voor de meeste toepassingen volstaat de gratis Basic-versie. In vergelijking met PDF Mod biedt PDFsam iets meer mogelijkheden, maar voor snelle bewerkingen is de interface minder gebruiksvriendelijk. Na het opstarten kies je één van de basisbewerkingen, bijvoorbeeld Samenvoegen of Splitsen. Nadien kan je nog van bewerking wisselen via de icoontjes links (klik op het pijltje linksboven om de namen van de bewerkingen te tonen).

 Het grootste verschil met PDF Mod is dat je geen thumbnails te zien krijgt van de individuele pagina’s. Om bijvoorbeeld pagina’s te extraheren, moet je eerst in een documentviewer, zoals Evince, bekijken welke pagina’s je nodig hebt en nadien die paginanummers in PDFsam invoeren. Om bestanden te splitsen of samen te voegen, is PDFsam krachtiger dan PDF Mod. Zo kan je bijvoorbeeld automatisch op bladwijzers splitsen, splitsen na bepaalde paginanummers (zelf in te geven) of om de zoveel pagina’s. Bij het samenvoegen van documenten biedt PDFsam geavanceerde mogelijkheden om de bladwijzers en de inhoudsopgave af te handelen. Pagina’s roteren is dan weer minder flexibel: je kunt enkel de even, oneven of alle pagina’s roteren. Eén individuele pagina roteren, is simpelweg niet mogelijk. Er is ook geen functie om pagina’s te verwijderen, tenzij je al de overige pagina’s extraheert naar een nieuw bestand.

 

PDF Chain

Voor de commandline liefhebbers bestaan verschillende tools om pdf-bestanden te bewerken. Eén van die tools is pdftk, dat zeer uitgebreide mogelijkheden bevat om bestanden te splitsen, samen te voegen, te comprimeren, te encrypteren, enzovoorts. Voor wie niet zo vertrouwd is met de commandline, bestaat ook een grafische schil bovenop pdftk: PDF Chain. Je merkt echter meteen dat PDF Chain maar een frontend is voor een commandline tool. Hier vind je geen previews van de pagina’s van je document en de interface bevat wel heel erg weinig uitleg bij de verschillende opties. Sommige functies hebben ook behoorlijk cryptische namen: bestanden samenvoegen doe je met de Catenate-optie en splitsen heet hier Burst. Uiteraard zijn dat gewoon de namen van de onderliggende pdftk-functies. Maar voor wie pdftk niet kent, is dat alles behalve logisch.

Toch moet je PDF Chain niet meteen afschrijven. Het bevat immers verschillende geavanceerde mogelijkheden die de twee vorige tools niet bieden. Zo kan je via de Permissions-knop de toegangsrechten van het uitvoerbestand verder beperken. Wil je bijvoorbeeld niet dat mensen het document afdrukken of tekst eruit kopiëren zonder dat ze het correcte wachtwoord ingeven? Geen probleem, met PDF Chain stel je zo dat in. De Background/Stamp-functie dient dan weer om een watermerk toe te voegen aan alle pagina’s van een pdf-document, naar keuze onder of boven de bestaande inhoud. Ook dat is een handige functie om hergebruik van jouw document in te perken. Via Attachment kan je attachments aan pdf-bestanden toevoegen en onder Tools vind je nog enkele meer geavanceerde functies. We raden je wel aan om de manpage van pdftk eens goed door te lezen als je met PDF Chain aan de slag wilt. Daarin vind je namelijk meer uitleg over de verschillende bewerkingen en bijvoorbeeld het invoerformaat om pagina’s te selecteren.

 

Conclusie

PDF Mod is een prima tool om kleine schoonheidsfoutjes recht te zetten in gescande documenten. Even een pagina verwijderen, op een andere plek zetten of roteren is zo gebeurd dankzij de thumbails en gebruiksvriendelijke interface. Wat dat betreft is het een goede aanvulling voor een scan-programma zoals gscan2pdf. Voor grotere documenten lijkt PDF Mod minder geschikt en ook de export-functie voor afbeeldingen werkt niet naar behoren. PDFsam en PDF Chain zijn eerder bedoeld om grote documenten te manipuleren dan om een occasioneel foutje uit een document te halen. De paginaselectie is wel minder gebruiksvriendelijk: je moet de paginanummers immers opzoeken in een ander programma en nadien numeriek ingeven. Beide programma’s bieden meer mogelijkheden dan PDF Mod, waarbij vooral PDF Chain opvalt met uitgebreide beveilingsopties. Het helpt wel om de manpage van pdftk te lezen als je met PDF Chain aan de slag gaat, want de interface is alles behalve intuïtief!