Ubuntun käyttö > Ubuntu tietokoneissa

Tekstin tunnistusohjelmat Ubuntuun (RATKAISTU)

(1/4) > >>

Pontus12:
Asensin tesseractin ja yritin skannata sillä käyttäen yagfia. Ei tunnistanut scanneria, vaikka Xsane tunnisti samoin kuin simplescan, joka taitaa suomenkielisessä Ubuntussa olevan sama kuin Kuvanluku-ohjelma.
Netistä löysin ilmaisia tekstintunnistusohjelmia, jotka ilmoittivat tuhoavansa tiedostot asiakkaan poistuttua. Kokeilin Light pdf ohjelmaa. Tavallisela ilmaisella ohjelmalla tunnistus jää lyhyeen, jolloin pitää hankkia maksullinen vip-versio.
Voin kyllä maksaa suomenkielisen tekstin tunnistusohjelmasta. Minulla oli Wnidows 95 versiossa maksullinen, jota käytin Virtualboxin kautta. Nyt Oracle virtualbolx ei suostunut enää avaamaan ysivitosta, Olisiko jollain neuvoja tai ehdotuksia?

SuperOscar:
Ylivoimaisesti paras tekstintunnistusohjelma on ABBYYn FineReader, joka ei koskaan ole saapunut Linuxiin. Sen OCR-moottori, jota komentoriviltä voi käyttää, on kuitenkin ollut (maksullisessa) jakelussa:

https://ocr4linux.com/en:start

Viimeksi kun oli tarvis, oli kuitenkin joku huoltokatkos tms., joka esti lataamisen. Kokeile.

Roberto:
Kokeilin gimagereader ohjelmaa ja sillä toimi skannaus ja myös kuvan avaus suoraan levyltä.
Jälki on ihan siedettävää.
tesseract-ocr-fin paketti on asennettu.
Canon CanonScan Lide20, Ubuntu 18.04.3, kernel 5.0.0-25

Pontus12:
Ohjelma skannasi hyvin, mutta kun sen piti tunnistaa teksti, niin se tiputti 4/5 osaa tekstiä pois. Kuvan se skannasi moitteettomasti. Kokeilin sekä pdf ja txt tiedostoina. Ei vaikutusta. Kieliasetus oli fi ja muuten annoin mennä oletusasetuksilla. Kokeilin myös vaihtaa 1200 dpi 600dpi. mutta ei sekään muuttanut tilannetta.

Roberto:
Kopioin ylläolevan tekstin ja lisäsin pari rivinvaihtoa.
Kaappasin siitä kuvan näytöltä ja tallensi koneelle png kuvaksi.
gimagereader luki kuvan ja irroitti siitä tekstin.
Tässä tulos:
Ohjelma skannasi hyvin, mutta kun sen piti tunnistaa teksti,

niin se tiputti 4/5 osaa tekstiä pois. Kuvan se skannasi moitteettomasti.

Kokeilin sekä pdf ja txt tiedostoina. Ei vaikutusta. Kieliasetus oli fi ja muuten annoin mennä oletusasetuksilla.
Kokeilin myös vaihtaa 1200 dpi 600dpi. mutta ei sekään muuttanut tilannetta.

Navigaatio

[0] Viestien etusivu

[#] Seuraava sivu

Siirry pois tekstitilasta