Kannattaa testata tiedostolla, joka varmasti sisältää etsittävän merkin.
Nämä toimivat minulla Bashissa, eli komentotulkin tehtäväksi annetaan muuntaa koodit UTF-8-merkiksi, jota grep osaa hakea, kun lokalisaatioasetukset ja kuun asento ovat oikein:
grep $'\xE2\x99\xAB' * -R
grep $'\u266b' * -R
grep '♫' * -R
Tämä toiminee komentotulkista ja terminaalista riippumatta, mutta vaatii LC_ALL=C -määrityksen ainakin minulla:
LC_ALL=C grep -P '\xE2\x99\xAB' * -R
Löytyykö ohjelmaa, millä voi hakea koneelta tiedostoja, joiden sisällössä
on esim. nuottien merkkejä (♫♫) tai muita erikoismerkkejä?
Ubuntu 14.04
Onko mitään lisävihjeitä, minkä tyyppisestä tiedostosta mahdollisesti on kyse? Grep ei suoraan löydä tuota UTF-8-tavujonoa esimerkiksi Word- tai LibreOffice-dokkareista, jotka ovat zip-pakattuja XML-tiedostoja. Tai miksi tuollaisia nuottimerkkejä ylipäätään on jossain tekstin seassa?