Kirjoittaja Aihe: Sivuston "peilaus"  (Luettu 1724 kertaa)

walto

  • Käyttäjä
  • Viestejä: 287
  • Ymph...
    • Profiili
    • Reveurs Domain
Sivuston "peilaus"
« : 02.08.09 - klo:21.22 »
Googlailin tässä HTML tutoriaaleja, ja löytyikin mukava sivusto, nimittäin w3schools. Tutoja on muistakin kielistä, mutta ongelmana on nettiyhteyden katkonaisuus (miniläppäri ja kesäreissut maalla). Olisi siis kätevää peilata sivustosta ainakin tutoriaalien kansioita offline tarkastelua varten

Koitin kyllä ohjelmaa WebHTTtrack, mutta se vaatisi url-listaa, jota w3schools ei näemmä tarjoa. Wgetillä saa varmaan ladattua sivuston/kansion sivuston palvelimelta, mutta --help toiminnosta en itse saanut paljoa selvää.
(koitin -E ohjaimella, jotta dokumentit olisivat .html muodossa, mutta tuloksena sain vain http://www.w3schools.com/HTML/index.html tiedoston, jonka firefox näytti valkoisena, tosin sivun otsikko näkyi.)
registered ubuntu user #23980
http://www.adressit.com/linuxkouluihin

Asus EEE 901, 2 GB DDR2, Jaunty Gnome
Pöytäkone: 2,8 GHz CPU, 1,3 GB RAM, 80, 33, 20 GB SATA ...

mgronber

  • Käyttäjä
  • Viestejä: 1458
    • Profiili
Vs: Sivuston "peilaus"
« Vastaus #1 : 03.08.09 - klo:01.47 »
Koitin kyllä ohjelmaa WebHTTtrack, mutta se vaatisi url-listaa, jota w3schools ei näemmä tarjoa.

Ei vaadi. Yksi url riittää mutta enemmänkin voi toki määritellä.

Lainaus
Wgetillä saa varmaan ladattua sivuston/kansion sivuston palvelimelta, mutta --help toiminnosta en itse saanut paljoa selvää.
(koitin -E ohjaimella, jotta dokumentit olisivat .html muodossa, mutta tuloksena sain vain http://www.w3schools.com/HTML/index.html tiedoston, jonka firefox näytti valkoisena, tosin sivun otsikko näkyi.)

Hieman sekalaista opiskelumateriaalia wget:n käytöstä:
http://www.editcorp.com/Personal/Lars_Appel/wget/v1/wget_7.html
http://www.devarticles.com/c/a/Web-Services/Website-Mirroring-With-wget/1/
http://mediakey.dk/~cc/mirror-website-using-wget/

Kannattaa myös muistaa käyttää parametria --wait.

walto

  • Käyttäjä
  • Viestejä: 287
  • Ymph...
    • Profiili
    • Reveurs Domain
Vs: Sivuston "peilaus"
« Vastaus #2 : 03.08.09 - klo:13.58 »
W3Schoolsilla taitaa olla tietokantapohjainen sivusto, joten ei oikein onnistu, mutta onneksi löytyi googlaamalla linkki valmiiseen pakettin.
registered ubuntu user #23980
http://www.adressit.com/linuxkouluihin

Asus EEE 901, 2 GB DDR2, Jaunty Gnome
Pöytäkone: 2,8 GHz CPU, 1,3 GB RAM, 80, 33, 20 GB SATA ...

mgronber

  • Käyttäjä
  • Viestejä: 1458
    • Profiili
Vs: Sivuston "peilaus"
« Vastaus #3 : 03.08.09 - klo:19.11 »
W3Schoolsilla taitaa olla tietokantapohjainen sivusto, joten ei oikein onnistu, mutta onneksi löytyi googlaamalla linkki valmiiseen pakettin.

Tietokantapohjaisuus ei vaikuta asiaan. Toki valmis paketti on parempi vaihtoehto kaikkien kannalta (ei kuormita palvelinta ja on nopeampi ladata).

Tässä kuitenkin esimerkki miten html-tutoriaalin lataus onnistuu:
Koodia: [Valitse]
$ wget -m -k -K -E -w 10 -np --user-agent "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)" http://www.w3schools.com/html/default.asp