Kirjoittaja Aihe: Sukututkimuskaavioita PDF-dokumentiksi  (Luettu 1780 kertaa)

$eppo

  • Käyttäjä
  • Viestejä: 190
    • Profiili
Sukututkimuskaavioita PDF-dokumentiksi
« : 02.02.14 - klo:18.20 »
Minulla on paljon paperille tulostettuja sukututkimusohjelman tulosteita. Ne ovat A4-kokoa pitäisi nyt saada ne skannerin kautta muutettua PDF-dokumenteiksi. Onko tähän muunnokseen olemassa Ubuntuun valmista ja sopivaa ohjelmaa.

Kuinka muunnos kannattaisi tehdä, että ei tarvitsisi kirjoittaa kaikkia sivuja teksturilla uudelleen ja muuttaa sitä kautta PDF:ksi?
Ubuntu 14.04 LTS

aku506

  • Käyttäjä
  • Viestejä: 356
    • Profiili
Vs: Sukututkimuskaavioita PDF-dokumentiksi
« Vastaus #1 : 02.02.14 - klo:18.32 »
Jos ei haittaa, että ne ovat PDF-tiedostossa kuvina, Sane ainakin osaa hommansa hyvin. Taitaapa jopa tullu nykyään oletusasennuksen mukana.

nm

  • Käyttäjä
  • Viestejä: 16246
    • Profiili
Vs: Sukututkimuskaavioita PDF-dokumentiksi
« Vastaus #2 : 02.02.14 - klo:18.52 »
Kuinka muunnos kannattaisi tehdä, että ei tarvitsisi kirjoittaa kaikkia sivuja teksturilla uudelleen ja muuttaa sitä kautta PDF:ksi?

Jos haluat nimenomaan tekstimuotoisen dokumentin, jotta esimerkiksi nimiä ja muuta tekstiä voi valita ja kopioida dokumentista tietokoneella, OCR-ohjelmalla voi yrittää muuntaa skannatun kuvan tekstiksi. Kaaviot tosin voivat olla hankalia tekstintunnistusohjelmille etenkin, jos niissä on paljon graafisia elementtejä.

OCRFeeder on toimiva peruskäyttöliittymä erilaisille avoimille tekstintunnistusohjelmille. Niistä Tesseract-ocr toimii yleensä parhaiten. Asenna siis Ubuntun pakettilähteistä tesseract-ocr, tesseract-ocr-fin  (tai muut tarvittavat kielipaketit) ja ocrfeeder.

Tools -> OCR Engines, valitse Tesseract ja paina Muokkaa. Lisää Engine arguments -riville kieliasetus -l fin:

Koodia: [Valitse]
$IMAGE $FILE -l fin > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
Paina OK.

Skannaus kannattaa tehdä n. 300 dpi:n tarkkuudella. Monet ohjelmat toimivat parhaiten tietyllä koolla ja 300 dpi:stä ylöspäin tarkkuudesta on vain haittaa. Tunnistetun tekstin voi sitten kopioida tekstinkäsittelyohjelmaan jatkokäsittelyä varten.
« Viimeksi muokattu: 02.02.14 - klo:18.56 kirjoittanut nm »

jeepster

  • Käyttäjä
  • Viestejä: 36
    • Profiili
    • Juhani Kellosalon kotisivut
Vs: Sukututkimuskaavioita PDF-dokumentiksi
« Vastaus #3 : 12.02.14 - klo:17.42 »
Minä olen tavannut viedä skannaukset pdf:ksi LibreOfficen kautta. Skannattu kuva lisätään LO:n tyhjälle sivulle ja valitaan Tiedosto-valikosta Vie PDF:nä. Kuvan tarkkuutta ja laatua säätämällä voi vaikuttaa pdf-tiedoston kokoon. Jos on useita esim. kaavakkeen sivuja, jokaisen voi viedä skannattuna LibreOfficen peräkkäisille sivuille ja saada koko kokonaisuuden yhteen pdf-tiedostoon.

JK