Kirjoittaja Aihe: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä. (Luettu 1736 kertaa)

Pontus12 · « : 14.06.22 - klo:16.30 »

En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä. Vanhemmassa koneessani (20.04 lts) se onnistui. Latasin sen Discoverysta, muta suomea ohjelma ei tunnistanut. Selasin Ubuntun suomenkielisiä keskustelualueita, mutta en löytänyt vastausta ongelmaani.
Vieläkö löytyy joku yksinkertainen tapa skannata tekstiä editoitavaan muotoon?

Ymmärtääkseni Gimagereader käyttää tesseract ocr ohjelmaa, vai olenko aivan hakoteillä? En myöskään löytänyt tesseractista suomenkielenlukua. Luultavasti ongelma on vain siinä, että en osaa asentaa sitä oikein. Harmillista, sillä ennen Gimagereader toimi minulla erittäin hyvin.

nm · « **Vastaus #1 :** 14.06.22 - klo:18.26 »

Vastasin jo tuolla edellisessä avauksessasi:

https://forum.ubuntu-fi.org/index.php?topic=57377.msg437894#msg437894

Pontus12 · « **Vastaus #2 :** 16.06.22 - klo:12.33 »

Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.

nm · « **Vastaus #3 :** 16.06.22 - klo:18.56 »

Lainaus käyttäjältä: Pontus12 - 16.06.22 - klo:12.33

Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Ilmoitus tarkoittaa, että suomen kielen oikolukusanastoa ei ole asennettu. Käytännössä sellaista ei edes ole saatavilla, koska GImageReader käyttää Hunspell-oikolukukirjastoa, ja Hunspell ei tue suomen kielen oikolukua. Eli voit kytkeä ilmoituksen pois päältä ja tyytyä siihen, että suomenkielisten tekstien oikoluku on tehtävä jälkeenpäin esimerkiksi LibreOfficella. Tämä ei sinänsä estä GImageReaderin käyttämistä suomenkielisille dokumenteille.

Lainaus käyttäjältä: Pontus12 - 16.06.22 - klo:12.33

Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.

No entä jos vaihdat OCR-tilaksi "plain textin" sijaan "hOCR,PDF"?

Katso myös edellinen keskustelu samasta aiheesta: https://forum.ubuntu-fi.org/index.php?topic=54636.0

Ubuntu Suomen keskustelualueet

Uutiset:

Kirjoittaja Aihe: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä. (Luettu 1736 kertaa)

Pontus12

En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.

nm

Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.

Pontus12

Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.

nm

Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.