Ubuntu Suomen keskustelualueet

Ubuntun käyttö => Ubuntu tietokoneissa => Aiheen aloitti: Pontus12 - 14.06.22 - klo:16.30

Otsikko: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.
Kirjoitti: Pontus12 - 14.06.22 - klo:16.30
En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä. Vanhemmassa koneessani (20.04 lts) se onnistui. Latasin sen Discoverysta, muta suomea ohjelma ei tunnistanut. Selasin Ubuntun suomenkielisiä keskustelualueita, mutta en löytänyt vastausta ongelmaani.
 Vieläkö löytyy joku yksinkertainen tapa skannata tekstiä editoitavaan muotoon?

Ymmärtääkseni Gimagereader käyttää tesseract ocr ohjelmaa, vai olenko aivan hakoteillä? En myöskään löytänyt tesseractista suomenkielenlukua. Luultavasti ongelma on vain siinä, että en osaa asentaa sitä oikein. Harmillista, sillä ennen Gimagereader toimi minulla erittäin hyvin.
Otsikko: Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.
Kirjoitti: nm - 14.06.22 - klo:18.26
Vastasin jo tuolla edellisessä avauksessasi:

https://forum.ubuntu-fi.org/index.php?topic=57377.msg437894#msg437894
Otsikko: Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.
Kirjoitti: Pontus12 - 16.06.22 - klo:12.33
Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.
Otsikko: Vs: En saa enää Gimagereaderia lukemaan suomenkielistä tekstiä.
Kirjoitti: nm - 16.06.22 - klo:18.56
Gimagereader kyllä asentui ja skannaa kuvan. Asetuksissa on myös suomenkieli, mutta ohjelma ilmoittaa, että "spellcheck dictioanary for finnish language" is not installed. Ehkä en lainannut sanasta sanaan, mutta ilmoitus oli tuollainen. Ohjelma ei siis tunnista suomea. Muita kieliä en ole kokeillut.

Ilmoitus tarkoittaa, että suomen kielen oikolukusanastoa ei ole asennettu. Käytännössä sellaista ei edes ole saatavilla, koska GImageReader käyttää Hunspell-oikolukukirjastoa, ja Hunspell ei tue suomen kielen oikolukua. Eli voit kytkeä ilmoituksen pois päältä ja tyytyä siihen, että suomenkielisten tekstien oikoluku on tehtävä jälkeenpäin esimerkiksi LibreOfficella. Tämä ei sinänsä estä GImageReaderin käyttämistä suomenkielisille dokumenteille.


Jos laitan sen skannaamaan optiolla "plain txt", ohjelma lukee tekstin kauniisti. Kaikki muotoilut kuitenkin menetetään.Minusta tuntuu, että joku pieni asia eu nyt ole kohdallaan sillä aikaisemmin skannasin pdf-muotoon. Tällaisena Gimagereaderilla ei ole minulle kovin paljon käyttöarvoa.

No entä jos vaihdat OCR-tilaksi "plain textin" sijaan "hOCR,PDF"?

Katso myös edellinen keskustelu samasta aiheesta: https://forum.ubuntu-fi.org/index.php?topic=54636.0