Een oplossing die mij al veel tijd heeft bespaard, is het kunnen doorzoeken van een verzameling pdf’s op meerdere - ook samengestelde - zoektermen tegelijk.
Henk-Jan van der Molen
Daartoe heb ik het onderstaande bash-script met pdfgrep geschreven, dat de zoekresultaten schrijft naar een tekstbestand. Van pdfgrep bestaat ook een Windows-versie, dus deze tip is voor een breed publiek bruikbaar. Beide staan op pc-active.nl
Voorbeeld:
ik heb een hele verzameling met leerboeken over Python in pdf-formaat. Ik zoek nu informatie over “object-georiënteerd programmeren” in Python 3. Daarnaast wil ik ook dat het leerboek ingaat op de koppeling van Python met SQL-databases. Met het script kan ik zien hoeveel hits mijn Python 3-handleidingen geven op de gekozen zoektermen. Door de zoekresultaten vervolgens te sorteren op bestandsnaam, kan ik eenvoudig nagaan welk document de meeste (gecombineerde) hits geeft.