Ubuntu Suomen keskustelualueet

Ubuntun käyttö => Ubuntu tietokoneissa => Aiheen aloitti: $eppo - 02.02.14 - klo:18.20

Otsikko: Sukututkimuskaavioita PDF-dokumentiksi
Kirjoitti: $eppo - 02.02.14 - klo:18.20
Minulla on paljon paperille tulostettuja sukututkimusohjelman tulosteita. Ne ovat A4-kokoa pitäisi nyt saada ne skannerin kautta muutettua PDF-dokumenteiksi. Onko tähän muunnokseen olemassa Ubuntuun valmista ja sopivaa ohjelmaa.

Kuinka muunnos kannattaisi tehdä, että ei tarvitsisi kirjoittaa kaikkia sivuja teksturilla uudelleen ja muuttaa sitä kautta PDF:ksi?
Otsikko: Vs: Sukututkimuskaavioita PDF-dokumentiksi
Kirjoitti: aku506 - 02.02.14 - klo:18.32
Jos ei haittaa, että ne ovat PDF-tiedostossa kuvina, Sane ainakin osaa hommansa hyvin. Taitaapa jopa tullu nykyään oletusasennuksen mukana.
Otsikko: Vs: Sukututkimuskaavioita PDF-dokumentiksi
Kirjoitti: nm - 02.02.14 - klo:18.52
Kuinka muunnos kannattaisi tehdä, että ei tarvitsisi kirjoittaa kaikkia sivuja teksturilla uudelleen ja muuttaa sitä kautta PDF:ksi?

Jos haluat nimenomaan tekstimuotoisen dokumentin, jotta esimerkiksi nimiä ja muuta tekstiä voi valita ja kopioida dokumentista tietokoneella, OCR-ohjelmalla voi yrittää muuntaa skannatun kuvan tekstiksi. Kaaviot tosin voivat olla hankalia tekstintunnistusohjelmille etenkin, jos niissä on paljon graafisia elementtejä.

OCRFeeder on toimiva peruskäyttöliittymä erilaisille avoimille tekstintunnistusohjelmille. Niistä Tesseract-ocr toimii yleensä parhaiten. Asenna siis Ubuntun pakettilähteistä tesseract-ocr, tesseract-ocr-fin  (tai muut tarvittavat kielipaketit) ja ocrfeeder.

Tools -> OCR Engines, valitse Tesseract ja paina Muokkaa. Lisää Engine arguments -riville kieliasetus -l fin:

Koodia: [Valitse]
$IMAGE $FILE -l fin > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
Paina OK.

Skannaus kannattaa tehdä n. 300 dpi:n tarkkuudella. Monet ohjelmat toimivat parhaiten tietyllä koolla ja 300 dpi:stä ylöspäin tarkkuudesta on vain haittaa. Tunnistetun tekstin voi sitten kopioida tekstinkäsittelyohjelmaan jatkokäsittelyä varten.
Otsikko: Vs: Sukututkimuskaavioita PDF-dokumentiksi
Kirjoitti: jeepster - 12.02.14 - klo:17.42
Minä olen tavannut viedä skannaukset pdf:ksi LibreOfficen kautta. Skannattu kuva lisätään LO:n tyhjälle sivulle ja valitaan Tiedosto-valikosta Vie PDF:nä. Kuvan tarkkuutta ja laatua säätämällä voi vaikuttaa pdf-tiedoston kokoon. Jos on useita esim. kaavakkeen sivuja, jokaisen voi viedä skannattuna LibreOfficen peräkkäisille sivuille ja saada koko kokonaisuuden yhteen pdf-tiedostoon.

JK