Chat GPT ehdottti tuota zstd-pakkausohjelmaa:
tar -cf PyCharm_$(date +%Y%m%d_%H%M%S).tar.zst -I 'zstd -15' PyChram/projektit/
Ja sillä paketin koko kutistui 34,8 %:iin. No, aika hyvä verrattuna edelliseen. Ja riittää. Tärkeintä on saada tekemänsä koodit talteen.
Ja kas kun katsoin less-ohjelmalla pakettia, niin sieltä tuli polkurakenteita selväkielisenä ulos. Tarkoittaa sitä, että niitä ei ole pakattu.
Mielestäni olisi mahdollista tehdä siinä pakkausohjelmassa template ja se olisi jossain kohdin pakettia (alussa kuitenkin). Aina kun tulee templaten mukainen merkkijono, se korvaisi sen ihan pienellä tunnisteella. Purkuvaiheessa sitten ne tunnisteet purettaisi niinä polkurakenteina. Uskoisin, että kompressiosuhde olisi ihan toinen. Tämä siis toimisi parhaiten sellaisissa paketeissa, joissa olisi paljon polkuja ja vähemmän itse dataa.
Chat GPT sanoi, että Borg ja Restic deduplikoivat polkuja. Ihmettelisinkin, jos tuollaista ei olisi keksitty jo.