Kirjoittaja Aihe: En saa jälleen gImage readeria tallentamaan tekstiä pdf tiedostona (RATKAISTU)  (Luettu 2395 kertaa)

Pontus12

  • Käyttäjä
  • Viestejä: 2400
    • Profiili
En saa jälleen gImage readeria tallentamaan tekstiä pdf tiedostona. Se on tallentanut minulle, mutta nyt en hahmota, mitä teen väärin. Yritin siis ladata siihen pdf-tiedoston, joka ei ollut tekstinä vaan kuvana muuttaakseni sen tekstiksi. En käsitä, mitä tein väärin. Yritin monta kertaa ja lopulta hermostuin ja kirjoitin puhtaaksi puoli sivua, jota tarvitsin. Vika ei siis ole ohjelmassa, koska se on toiminut hyvin, vaan jossakin, mitä ilmeisesti teen nyt joko väärässä järjestyksessä tai väärin.

Olisin kiitollinen ystävällisestä opastuksesta,
« Viimeksi muokattu: 25.09.19 - klo:18.48 kirjoittanut Pontus12 »

Roberto

  • Käyttäjä
  • Viestejä: 174
    • Profiili
Ratkaisua helpottaisi jos kerrot missä menee pieleen.
Onhan siinä yläpalkissa Perusteksti eikä hOCR,PDF?
Ja ilmestyykö teksti oikeanpuoleiseen kenttään?
Anna sen tallentaa tekstitiedostoon (.txt) kuten aiemminkin.
Sitä on sitten helppo muokata ja liittää minne haluaa.
Dell OptiPlex 7470 (All in One), i5-9500T (6) @ 4,400GHz, 32 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Dell OptiPlex 7440 (All in One), i5-6500  (4) @ 3.600GHz, 16 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Jäähyllä olevat: Amiga 500, C64

Pontus12

  • Käyttäjä
  • Viestejä: 2400
    • Profiili
Minulla optio hOCR,pdf ja pystyin lataamaan siihen monisivuisen kuva pdf tekstin, jonka ohjelma luki ja muutti teksti pdf-tiedostoksi. Kappalejako säilyi sellaisenaan. Virheitä oli hyvin vähän jos ollenkaan. Jos luen sen optiolla "plain text", niin koko pdf täytyy rakentaa uudestaan tekstistä, josta puuttuu kappalejako.

Nyt en jostain syystä saa luettua kuva pdf-tiedostoa teksti pdf-tiedostoksi.

Pontus12

  • Käyttäjä
  • Viestejä: 2400
    • Profiili
Nyt se kuitenkin onnistui. lataa kuva-pdf tiedosto kuvanlukuohjelmalla tai hae  aikaisemmin skannaamasi pdf.
Laita optioksi  hOCR, pdf ja lue kuvatiedosto. Se lukee sitä jonkin aikaa sivumäärästä riippuen. Kun se on valmis, niin valitse oikeanpuoleisesta paneelista pieni ikoni "Export to pdf", minkä jälkeen tiedosto löytyy valitsemastasi hakemistosta. Ohjelma voi skannata myös suoraan, mutta varsinkin monisivuisen tiedoston skannaan mieluummin "Simple scan" ohjelmalla, joka on sama kuin Kde:ssä minulla oleva "Lue kuvatiedosto".

Tämä teksti on myös itselleni muistiksi,  jos vielä sekoilen tämän ohjelman kanssa. GImageReader on hieno ohjelma.

Roberto

  • Käyttäjä
  • Viestejä: 174
    • Profiili
Hienoa että sait toimimaan.
Minulla on tapana tallentaa teksti muodossa, kun sitä on helppo täydentää ja muokata.
Rivinvaihdot ja kappalejaot ovat samoin kuin alkuperäisessä pdf tiedostossa.
Vain Tab (sarkain) merkit katoavat tai oikeastaan muuttuvat yhdeksi välilyönniksi.
« Viimeksi muokattu: 25.09.19 - klo:19.11 kirjoittanut Roberto »
Dell OptiPlex 7470 (All in One), i5-9500T (6) @ 4,400GHz, 32 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Dell OptiPlex 7440 (All in One), i5-6500  (4) @ 3.600GHz, 16 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Jäähyllä olevat: Amiga 500, C64