Ubuntu Suomen keskustelualueet
Ubuntun käyttö => Ohjelmointi, palvelimet ja muu edistyneempi käyttö => Aiheen aloitti: matsukan - 24.03.16 - klo:10.16
-
Mikä tapa olisi mahdollisimman tehokas tapa parsia isohko xml (noin miljoona riviä) tietokantaan ? PHP 5 ja simplexml.llä menee noin 2 -3 tuntia riippuen koneesta.
siis millä kielellä ja tekniikalla ?
-
Tietokantainsertit tuossa lienevät pullonkaulana, jos teet niitä yksittäin jokaiselle xml-tiedostosta luetulle tietueelle. Pitäisi tehdä batch-insertti tai joku vastaava tietokantakohtainen optimointi. Mikä tietokantaohjelmisto on kyseessä?
-
postgresql
-
postgresql
Ohjeistusta isompien datamassojen kirjoittamiseen: http://www.postgresql.org/docs/current/interactive/populate.html