Kirjoittaja Aihe: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.  (Luettu 1147 kertaa)

Pontus12

  • Käyttäjä
  • Viestejä: 2474
    • Profiili
En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä. Vanhemmassa koneessani (20.04 lts) se onnistui. Latasin sen Discoverysta, muta suomea ohjelma ei tunnistanut. Selasin Ubuntun suomenkielisiä keskustelualueita, mutta en löytänyt vastausta ongelmaani.
 Vieläkö löytyy joku yksinkertainen tapa skannata tekstiä editoitavaan muotoon?

Ymmärtääkseni Gimagereader käyttää tesseract ocr ohjelmaa, vai olenko aivan hakoteillä? En myöskään löytänyt tesseractista suomenkielenlukua. Luultavasti ongelma on vain siinä, että en osaa asentaa sitä oikein. Harmillista, sillä ennen Gimagereader toimi minulla erittäin hyvin.

nm

  • Käyttäjä
  • Viestejä: 16374
    • Profiili

Pontus12

  • Käyttäjä
  • Viestejä: 2474
    • Profiili
Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.
« Viimeksi muokattu: 16.06.22 - klo:12.50 kirjoittanut Pontus12 »

nm

  • Käyttäjä
  • Viestejä: 16374
    • Profiili
Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Ilmoitus tarkoittaa, että suomen kielen oikolukusanastoa ei ole asennettu. Käytännössä sellaista ei edes ole saatavilla, koska GImageReader käyttää Hunspell-oikolukukirjastoa, ja Hunspell ei tue suomen kielen oikolukua. Eli voit kytkeä ilmoituksen pois päältä ja tyytyä siihen, että suomenkielisten tekstien oikoluku on tehtävä jälkeenpäin esimerkiksi LibreOfficella. Tämä ei sinänsä estä GImageReaderin käyttämistä suomenkielisille dokumenteille.


Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.

No entä jos vaihdat OCR-tilaksi "plain textin" sijaan "hOCR,PDF"?

Katso myös edellinen keskustelu samasta aiheesta: https://forum.ubuntu-fi.org/index.php?topic=54636.0
« Viimeksi muokattu: 16.06.22 - klo:18.58 kirjoittanut nm »