Olen tässä käytellyt Pandoc'ia tekstin muotoiluun. Nyt on tullut vastaan ongelma näkymättömien merkkien käsittelyssä. Esimerkiksi
- Unicode char \u8
Niitä on lukematon määrä, mutta havainnollistan tilannetta tavuviivalla, siis tavutusehdotuksella
- &-s-h-y-;
Olen löytänyt joitain ohjeita näiden merkkien poistamiseen, mutta ne poistavat liian paljon. Ainakin pitäisi säilyä "tavalliset kirjaimet" kaikilla (utf-8) kielillä
- åäöÅÄÖ
- venäläiset kirjaimet
- Ábcdêãçoàúü
- jne
ONGELMA.
Se mitä haluaisin, on että copy pastessa nuo näkymättömät merkit eivät seuraisi mukana.
Nyt kun copy-pastettaa alla olevia tekstejä eri ohjelmien välillä, siellä seuraa näitä näkymättömiä merkkejä mukana. Myöhemmin ne saattavat aiheuttaa ongelmia, joiden jäljittäminen on hankalaa.
Alkuperäinen teksti
Weli kulta weikkoseni, Kaunis kielikumppalini! Harwoin yhtehen yhymmä, Saanemma sanelemahan, Näillä raukoilla rajoilla, Polosilla Pohjan mailla; Pannos nyt käsi kätehen, Haka toisehen hakahan, Lauloaksemma hywiä, Parahia pannaksemma;
Sama teksti tavutettuna
Weli kulta weikkoseni, Kaunis kielikumppalini! Harwoin yhtehen yhymmä, Saanemma sanelemahan, Näillä raukoilla rajoilla, Polosilla Pohjan mailla; Pannos nyt käsi kätehen, Haka toisehen hakahan, Lauloaksemma hywiä, Parahia pannaksemma;
Tämän tavutetun tekstin kun copy-pastettaa esim geditiin, niin ikkunan leveyttä muuttamalla näkee tavuviivan paikat.
Vielä tavutettu teksti kuin cat --show-nonprinting sen antaa
WeM-BM--li kulM-BM--ta weikM-BM--koM-BM--seM-BM--ni, KauM-BM--nis kieM-BM--liM-BM--kumpM-BM--paM-BM--liM-BM--ni! ...