Ook al verloopt steeds meer communicatie digitaal, toch ontsnap je soms niet aan een ouderwets papieren document. Wil je dat digitaliseren, dan heb je een scanner én de juiste software nodig. We stellen je hier drie verschillende scanprogramma’s voor met elk hun sterke én zwakke punten.

 

Simple Scan

Ubuntu en Linux Mint maken het gebruik van een scanner wel érg eenvoudig. Je hoeft enkel de scanner aan te sluiten, in te schakelen en het voorgeïnstalleerde Simple Scan te starten (via “Menu > Grafisch > Scannen”). Dat programma doet zijn naam alle eer aan, want eenvoudiger kan men het écht niet meer maken. Wil je meteen aan de slag, gebruik dan de grote Scan-knop om één of meerdere pagina’s in te scannen. Nadien kun je elke pagina nog verder bewerken via een rechtermuisklik op de pagina. Het aantal bewerkingen is beperkt, maar volstaat voor de meeste toepassingen: pagina’s roteren, bijsnijden (met presets voor bijvoorbeeld A4-formaat), kopiëren, verwijderen of herordenen. Het resultaat bewaar je in JPEG- of PNG-formaat (voor één scan) of PDF-formaat (voor scans van meerdere pagina’s).

Extra opties zijn goed verborgen. Zo krijg je via het uitklapmenu naast de Scan-knop de keuze tussen twee kwaliteitsinstellingen (tekst of foto), zonder verdere uitleg over de precieze verschillen. Beschikt je scanner over een automatische document feeder, dan schakel je die via ditzelfde menu in. In het voorkeurenvenster pas je de resolutie van de twee kwaliteitsinstellingen aan. Standaard is dat 150 dpi voor tekst en 300 dpi voor foto’s. Ook helderheid en contrast regel je hier, al is het gissen naar het effect op je scans. Simple Scan werkt immers niet met scan previews: aanpassingen kun je dus beter achteraf doen in bijvoorbeeld Gimp. Tot slot bevat Simple Scan nog de mogelijkheid om je document af te drukken of te versturen via e-mail.

 

XSane

Zoek je toch nét iets meer opties dan Simple Scan? Installeer dan XSane via het gelijknamige pakket. Je kunt XSane standalone starten of vanuit Gimp, via “Bestand > Aanmaken > Xsane”. Xsane is uitermate geschikt om foto’s in te scannen. Met de preview-knop krijg je in enkele seconden een voorbeeld te zien van wat er op jouw scanner ligt. Vervolgens selecteer je het gewenste gebied om in te scannen en pas je (indien nodig) één van de vele instellingen aan. Klik vervolgens op de Scan-knop om het eindresultaat in Gimp te importeren. Start je XSane standalone, dan heb je de keuze uit zes verschillende uitvoermogelijkheden: de afbeelding bekijken, opslaan, kopiëren, e-mailen, faxen (!) of een document met meerdere pagina’s aanmaken. Aan de faxondersteuning en het gebruik van .PNM als standaard uitvoerformaat zie je wel dat XSane al even meegaat. Gelukkig ondersteunt XSane ook meer gangbare formaten, zoals JPEG, PNG of TIFF. Erg handig is wel dat XSane meerdere scans na elkaar automatisch bewaart met een volgnummer, bijvoorbeeld: scan001.png, scan002.png, enzovoorts. Op die manier werk je je erg snel door een reeks documenten heen, zonder overbodige dialoogvensters.

Het is ook mogelijk om meerdere delen in de preview te selecteren en toe te voegen aan een batch list. Via “Window > Show batch” scan zie je de huidige batch list en start je met het scannen van alle geselecteerde delen. Dat is vooral gemakkelijk om snel individuele foto’s uit een grotere pagina te scannen. Qua instelmogelijkheden stelt XSane overigens niet teleur: resolutie, helderheid, contrast, witbalans, rotatie van de afbeelding en nog veel meer. In het preview-venster zie je meteen het effect van de instellingen. Wil je dezelfde instellingen later nog eens gebruiken voor je scans? Dat kan via “Preferences > Save device settings” en “Load device settings”. De enige nadelen aan XSane zijn, dat het eigenlijk niet geïntegreerd is je desktopomgeving (een reeds geïnstalleerde printer moet je bijvoorbeeld nog eens afzonderlijk ingeven in XSane) en dat de interface wat rommelig overkomt als je geen behoefte hebt aan allerlei uitgebreide instellingen.

 

gscan2pdf

Om langere documenten in te scannen, bestaat er een veel betere optie dan Simple Scan of XSane: gscan2pdf. Dat programma is specifiek ontwikkeld om boeken in te scannen en met een zo hoog mogelijke kwaliteit om te zetten naar PDF-formaat. Het biedt niet zoveel scanopties als XSane, maar het doet wel aan een degelijke nabewerking. Bekijk maar eens het Post-processing-gedeelte van het scandialoogvenster. Zo kUn je bijvoorbeeld enkel de even of de oneven pagina’s automatisch laten roteren als je die steeds omgekeerd inscant (omdat je maar langs één kant van de scanner het boek eruit kunt laten hangen) en zal gscan2pdf overbodige randen in de scans trachten te verwijderen. Of van een boek op A5-formaat (waarbij je steeds twee pagina’s tegelijk scant) kun je alle scans automatisch in twee laten delen om een PDF-bestand aan te maken, waarbij alle pagina’s afzonderlijk ingescand lijken te zijn. Daarvoor tik je de optie “Clean up images” aan, klik je op de “Options-knop” ernaast en kies je voor een dubbele vormgeving, die je als twee afzonderlijke pagina’s wilt exporteren. Plooien in het midden van de scan worden daarbij ook netjes verwijderd, al moet je misschien de twee pagina’s nog eens opschonen. Verder zijn er ook enkele basisbewerkingsmogelijkheden (verscherpen, bijsnijden, omzetten naar zwart/wit) en kun je elke pagina snel in Gimp openen, als je meer werk hebt.

Tot slot bevat gscan2pdf ondersteuning voor OCR (Optical Character Recognition). Dat is best interessant, want standaard maakt gscan2pdf PDF-bestanden aan, die bestaan uit een reeks afbeeldingen. Dergelijke PDF’s kun je dus niet op trefwoorden doorzoeken, tenzij je er OCR op loslaat. gscan2pdf ondersteunt drie verschillende OCR-engines: tesseract, gocr en cuneiform. Tesseract wordt bij installatie van gscan2pdf standaard meegeleverd. Je moet wel nog afzonderlijke modules installeren per taal, die je wilt gebruiken. Standaard was enkel Engels beschikbaar op ons systeem: installeer het pakket tesseract-ocr-nld om ondersteuning voor Nederlands toe te voegen. Tesseract werkte in onze test vrij goed op een Nederlands document in meerdere kolommen. Eenvoudigere documenten, zoals boeken zonder afbeeldingen, worden uiteraard nog beter herkend.

gscan2pdf toont je de herkende tekst voor elke pagina en je kunt die desgewenst nog verbeteren. Bij het opslaan naar PDF krijg je nog steeds een bestand met één afbeelding per pagina, maar de herkende tekst is per pagina ook nog eens (onzichtbaar) als tekst in de PDF bewaard. Je kunt dus zoeken op trefwoorden en je PDF-viewer zal netjes naar de plaats in de pagina springen waar dat woord gevonden is. Sterker nog: door op de afbeelding te klikken en te slepen komt plots de tekst tevoorschijn en kun je die zelfs kopiëren! Dit is een erg interessante toepassing van het OCR-mechanisme. Je ziet immers het originele document inclusief opmaak en afbeeldingen, maar onderliggend is de OCR-output beschikbaar om te zoeken en te kopiëren. Dat de OCR-engine af en toe een steekje laat vallen is daardoor minder erg, want je ziet immers nog steeds het originele document!

Deze keer wijzen we geen winnaars of verliezers aan. Elk programma heeft zijn eigen gebruikstoepassing: Simple Scan om snel even iets in te scannen, XSane om foto’s in te scannen en gscan2pdf om langere tekstdocumenten te digitaliseren. Voor occasioneel gebruik volstaat Simple Scan prima, terwijl XSane en gscan2pdf allebei aanraders zijn voor de echte power user.