Standardin mukaan monikielistä tekstiä sisältävä aineisto lajitellaan myös suomen kielessä v ja w erillisinä kirjaimina.
Puhutko nyt SFS:n standardista vai suomen kirjakielen normista vai kummastakin?
Käsite ”monikielinen teksti” pitäisi minusta joka tapauksessa määritellä. Pelkkä erilähtöisten nimien läsnäolo kuten puhelinluettelossa ei tee tekstistä monikielistä missään järkevässä mielessä; tämänhän tajuaa selvimmin vertaamalla puhelinluetteloa tietosanakirjaan, jossa myös on nimiä ja jopa sanoja monista kielistä, mutta selitykset ovat kaikki yhdellä ja samalla kielellä.
Sort-komennon todennäköisen syöte on monikielinen teksti, joten sort-komento aakkostaa tekstin täysin standardinmukaisesti.
Päättelysi on jokseenkin nurinkurista. Lajittelujärjestyksen määrittää lokaali, jonka pitää toimia lokaalia koskevien sääntöjen mukaan, ei se, mistä ohjelmasta on kyse ja millaista syötettä sille ”todennäköisesti” lähetetään. Eri ohjelmat saavat sitten tiedon lajittelusäännöistä lokaalilta eikä jokaisen tarvitse keksiä pyörää uudelleen.
Ja jos minun OpenOfficessa (tai nyttemmin useimmin Kilessä) käsittelemistäni teksteistä puhutaan, on todennäköistä, että ne ovat monikielisiä paljon relevantimmassakin mielessä kuin puhelinluettelo: teksti kulkee joko suomeksi tai englanniksi ja sisältää vähän väliä sitaatteja joko suomeksi, englanniksi tai jollakin muulla kielellä. Lähdeluettelon aakkostus tapahtuu kuitenkin tekstin pääkielellä, ja jos se on suomi, aakkostuksessa pitää noudattaa suomen normia, että V ja W aakkostetaan yhteen.
Tarkistin mikä tilanne on uusimmassa puhelinluettelossa.
Vaikka puhelinluettelosi aakkostaisi W:n ennen A:ta, se ei muuta normia eikä standardia.
Muoks: Mutta asiaan taas. Kun tuosta /usr/share/i18n/locales/fi_FI-tiedostosta laventaa merkkikoodit, homma selviää vähän. Ensin nähtävästi kerrotaan, että makronillisen u:n jälkeen (lienee järjestyksessä viimeinen u:n muoto) järjestetään V ja W sekä samat merkit kaikenlaisin tarkkein varustettuna:
reorder-after ū
v <v>;V;<BAS>;<MIN>
...
w <w>;W;<BAS>;<MIN>
...
Järjestys näyttäisi tuon perusteella kuitenkin olevan juuri että ensin V, sitten W. Mutta kai täytyy olla myös jokin tapa kertoa, että V ja W pitäisi ensisijaisesti lajitella samana merkkinä ja vasta toissijaisesti (jos sama jono esiintyy sekä V:llisenä että W:llisenä) erikseen?