Ubuntu Suomen keskustelualueet

Ubuntun käyttö => Ubuntu tietokoneissa => Aiheen aloitti: peran - 19.02.07 - klo:09.30

Otsikko: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: peran - 19.02.07 - klo:09.30
Haluaisin ladata Ubuntu tutuksi wiki-kirjan omalle kotikoneelleni, jotta voin käyttää sitä off-linena.

Kuinkahan ko. onnistuisi.

wget:llä yritin -r - vivulla, mutta se latasi robot.txt-tiedoston ja wikikirjan etusivun:
Koodia: [Valitse]
wget -r http://fi.wikibooks.org/wiki/Ubuntu_tutuksi

Guukkeliakin yritin käyttää, mutta on varsin vaikea keksiä hakusanoja.

Tosin voinhan räpeltää ohjelman, mutta ensin kysyn onko valmista.
Otsikko: Vs: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: JJK - 19.02.07 - klo:09.48
Repoista löytyy ainakin WebHTTrack Website Copier
Otsikko: Vs: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: janne - 19.02.07 - klo:19.04
Kuinkahan ko. onnistuisi.

wget:llä yritin -r - vivulla, mutta se latasi robot.txt-tiedoston ja wikikirjan etusivun:
Koodia: [Valitse]
wget -r http://fi.wikibooks.org/wiki/Ubuntu_tutuksi

tuohon wikikirjaan olisi tietysti kätevä lisätä kirjan sisältö ladattavaksi jonnekin pakattuna/pdf:nä.

no, kuitenkin... kiltisti käyttäytyvä webbisivuja läpikäyvä softa tottelee robots.txt-tiedostossa annettuja määrityksiä. wgetistä tuon pystyy disabloimaan, mutta yleisesti ottaen se ei ole kovin hyvä idea.
Otsikko: Vs: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: mgronber - 19.02.07 - klo:21.44
wgetistä tuon pystyy disabloimaan, mutta yleisesti ottaen se ei ole kovin hyvä idea.

Miten? Kerran muistan tuota etsineeni enkä löytänyt.
Otsikko: Vs: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: Vapaan koodin kananmuna - 19.02.07 - klo:23.40
wgetistä tuon pystyy disabloimaan, mutta yleisesti ottaen se ei ole kovin hyvä idea.

Miten? Kerran muistan tuota etsineeni enkä löytänyt.
http://www.gnu.org/software/wget/faq.html#3.0
Otsikko: Vs: Millä ohjelmalla onnistuu html-puun lataaminen.
Kirjoitti: mgronber - 20.02.07 - klo:00.16
wgetistä tuon pystyy disabloimaan, mutta yleisesti ottaen se ei ole kovin hyvä idea.
Miten? Kerran muistan tuota etsineeni enkä löytänyt.
http://www.gnu.org/software/wget/faq.html#3.0

Kiitän.