TIP Zoeken binnen pdf’s

,

Een oplossing die mij al veel tijd heeft bespaard, is het kunnen doorzoeken van een verzameling pdf’s op meerdere - ook samengestelde - zoektermen tegelijk.


Henk-Jan van der Molen

Daartoe heb ik het onderstaande bash-script met pdfgrep geschreven, dat de zoekresultaten schrijft naar een tekstbestand. Van pdfgrep bestaat ook een Windows-versie, dus deze tip is voor een breed publiek bruikbaar. Beide staan op pc-active.nl 
Bash script 2
Voorbeeld:
ik heb een hele verzameling met leerboeken over Python in pdf-formaat. Ik zoek nu informatie over “object-georiënteerd programmeren” in Python 3. Daarnaast wil ik ook dat het leerboek ingaat op de koppeling van Python met SQL-databases. Met het script kan ik zien hoeveel hits mijn Python 3-handleidingen geven op de gekozen zoektermen. Door de zoekresultaten vervolgens te sorteren op bestandsnaam, kan ik eenvoudig nagaan welk document de meeste (gecombineerde) hits geeft. 

'Meld je aan voor de nieuwsbrief'

'Abonneer je nu op een of meerdere van onze nieuwsbrieven en blijf op de hoogte van onze activiteiten!'

Aanmelden