In Lezerstips in PC-Active 318 (pagina 33) vertelde Henk-Jan van der Molen hoe hij een bash-script voor pdfgrep heeft geschreven, dat het mogelijk maakt om te kunnen zoeken binnen een verzameling PDF's. Zijn uitgewerkte bash-script vind je hier. 

 # *** zoekpdf script ***
#!/bin/bash
zoek () {
echo "* Zoek in pdf files naar: $1" | tee -a gevonden-in-pdfs.txt
echo | tee -a gevonden-in-pdfs.txt

# pdfgrep parameters evt. aan te passen, samen met zoekmasker *.pdf
# -i = ignore case; # -c = count all occurences in file; #
-r = recurse through folders, exclude symlinked files
# -R = recurse through folders, include symlinked files
pdfgrep -icR --include "*.pdf" "$1" | tee -a gevonden-in-pdfs.txt
echo | tee -a gevonden-in-pdfs.txt
}
# main
#
echo "*** Zoek pdf script ***" | tee gevonden-in-pdfs.txt
echo | tee -a gevonden-in-pdfs.txt
echo "* pdf files gevonden:" | tee -a gevonden-in-pdfs.txt
find . -type f -iname '*.pdf' | tee -a gevonden-in-pdfs.txt
echo | tee -a gevonden-in-pdfs.txt

# Neem een paar minuten om de juiste (deel)termen te bedenken # .. minimaliseer elke term om ook vervoegingen e.d. te kunnen vinden

zoek 'python3'
zoek 'object oriented programming'
zoek 'sql'

# Verwijder de 'nul' hits in gevonden-in-pdfs.txt met regex ^.+:0$ # Daarna vervangen alle (regex) \n\n met \n en ^\* met \n* # *** einde zoekpdf script ***