Kirjoittaja Aihe: wgetillä zip tiedostot talteen sivustolla olevien linkkien takaa?  (Luettu 5726 kertaa)

pkill

  • Käyttäjä
  • Viestejä: 189
    • Profiili
Vanhaan hyvään 1nsane peliin on lisäautoja tuolla sivustolla parisen sataa. On vain typerästi jokainen latauslinkki yhden ylimääräisen linkin takana. Millä komennolla wgetin saisi ne tuolta kaivamaan ilman että lähtee noita muita sivuelementtien linkkejä seurailemaan?.

https://hoovtech.net/lxr/insanevehicle.php

Itse peli nyt tarjouksessa 2,5€. Winellä toimii hienosti vanhemmallakin raudalla.
https://www.gog.com/en/game/1nsane

nm

  • Käyttäjä
  • Viestejä: 16529
    • Profiili
Lataa "Vehicles IDF List", jossa on tiedostojen nimet kätevämmässä taulukossa:
Koodia: [Valitse]
wget https://hoovtech.net/lxr/insanevehiclesworkingcopy_files/sheet001.htm
Muodosta linkit ja tallenna tiedostoon vehicles.txt:
Koodia: [Valitse]
grep xl69 sheet001.htm | sed 's|^.*>\(.*\)<.*$|https://hoovtech.net/lxr/upload/insane/vehicle/\1.zip|' > vehicles.txt
Lataa wgetillä:
Koodia: [Valitse]
wget -i vehicles.txt
Tuossa listassa on näemmä yli 1000 mallia, ja vain osa on saatavilla sivuston kautta, eli suurin osa linkeistä palauttaa 404:n, mutta se ei haittaa olemassa olevien tiedostojen latauksia.
« Viimeksi muokattu: 31.12.24 - klo:12.52 kirjoittanut nm »

pkill

  • Käyttäjä
  • Viestejä: 189
    • Profiili
Lataa "Vehicles IDF List", jossa on tiedostojen nimet kätevämmässä taulukossa:
Koodia: [Valitse]
wget https://hoovtech.net/lxr/insanevehiclesworkingcopy_files/sheet001.htm
Muodosta linkit ja tallenna tiedostoon vehicles.txt:
Koodia: [Valitse]
grep xl69 ../sheet001.htm | sed 's|^.*>\(.*\)<.*$|https://hoovtech.net/lxr/upload/insane/vehicle/\1.zip|' > vehicles.txt
Lataa wgetillä:
Koodia: [Valitse]
wget -i vehicles.txt
Tuossa listassa on näemmä yli 1000 mallia, ja vain osa on saatavilla sivuston kautta, eli suurin osa linkeistä palauttaa 404:n, mutta se ei haittaa olemassa olevien tiedostojen latauksia.

Hyvä oivallus. Kiitos. Nyt on autot ladattu  8)

Tuosta piti ottaa piste pois alusta, niin toimi.
Koodia: [Valitse]
grep xl69 ./sheet001.htm | sed 's|^.*>\(.*\)<.*$|https://hoovtech.net/lxr/upload/insane/vehicle/\1.zip|' > vehicles.txt