Kirjoittaja Aihe: Skannaus tekstitiedostoksi/tekstin lukeminen kuvatiedostosta  (Luettu 3861 kertaa)

Sudo Vilén

  • Käyttäjä
  • Viestejä: 97
  • I'm an ice sculptor - last night i made a cube...
    • Profiili
Niin, löytyykö linuxille ohjelmaa, jolla saisin tekstiä sisältävän kuvatiedoston muutettua tekstitiedostoksi, hätäpäissäni en ainakaan löytänyt?
SHUT UP AND LISTEN TO HIM PLAY!

Jallu59

  • Käyttäjä
  • Viestejä: 3430
    • Profiili
Minun mielstäni jo Xsane antaa skannauksen jälkeisessä näyttötilassaan k.o vaihtoehdon tallennuksen lisäksi.
Siinä taidetaan puhua OCR:stä, mikä tarkoittaa muistaakseni "Optical Character Reading".
(en voi nyt tarkistaa)

T:Jallu59
« Viimeksi muokattu: 09.01.08 - klo:16.27 kirjoittanut Jallu59 »
Jari J. Lehtinen, Wanhempi (iki?)tietoteekkari & tietotekniikkakonsultti Turust, P4-HT / 3,0 GHz, Intel945 IGP 226MB & 4GBram & UbuntuStudio 14.04. Toshiba Satellie 50-C, i5 dual-core 2,3GHz, ubuntu-mate 16.04 LTS

UbunTux

  • Käyttäjä
  • Viestejä: 2046
  • KubunTux
    • Profiili
gocr

Olen käyttänyt sitä epäsuorasti videoiden tekstitystille.
KDE neon
Uudempaa KDE:tä Ubuntulla

janne

  • Käyttäjä
  • Viestejä: 5150
    • Profiili
gocr

luin juuri myös aika mairittelevan arvostelun ohjelmasta nimeltä tesseract-ocr. tosin ymmärsin, että kehityksessä on ollut jonkin verran taukoa, enkä osaa sanoa sen soveltumisesta esim. suomen oikolukuun.
Janne

ilkkak

  • Käyttäjä
  • Viestejä: 405
    • Profiili
Minun mielstäni jo Xsane antaa skannauksen jälkeisessä näyttötilassaan k.o vaihtoehdon tallennuksen lisäksi.
Siinä taidetaan puhua OCR:stä, mikä tarkoittaa muistaakseni "Optical Character Reading".
(en voi nyt tarkistaa)

T:Jallu59

Joo - sitä se meinaa. Onko jollakulla ollut kokemusta ocr:n käytöstä. Omani on, että kestää tautisen kauan ja tulos on hyvin vaatimaton.

Ville Pöntinen

  • Käyttäjä
  • Viestejä: 2078
    • Profiili
Omien kokemusten mukaan tekstiä pitää olla vähintään kolme sivua, että ocr:n käytöllä (voi) voittaa aikaa. Pari sivua kirjoittaa nopeammin käsin.

Lisäksi tekstin pitää olla kohtuu laadukasta (siis ei esim. kopionkopionkopio tai faxi) eikä tietenkään millään eksoottisella fontilla. Myös palstat, taulukot jne tekevät viimeistelyyn niin paljon lisätyötä, ettei ajallisesti kannata.

UbunTux

  • Käyttäjä
  • Viestejä: 2046
  • KubunTux
    • Profiili
Tuolla olisi jotain asiaa
http://www.linux.com/articles/50658

Minusta muotoilu on täysin sivuseikka, kunhan rivinvaihdot toimivat ja teksti virtaa ulos lähes oikein. Kuitenkin joutuu muotoilemaan uudelleen  melkein kaiken aika radikaalisti.
KDE neon
Uudempaa KDE:tä Ubuntulla

ilkkak

  • Käyttäjä
  • Viestejä: 405
    • Profiili
Niin, löytyykö linuxille ohjelmaa, jolla saisin tekstiä sisältävän kuvatiedoston muutettua tekstitiedostoksi, hätäpäissäni en ainakaan löytänyt?

Latasin SimpleOcr:n http://www.download.com/SimpleOCR/3000-2070_4-10152129.html. Se asentui (Kubuntu gutsy) winen kanssa ilman ongelmia (on se vaan windows ohjelmien asennus hassun näköistä sekavaa  puuhastelua) ja toimii.

komentoriviltä wine .wine/drive_c/Ohjelmatiedostot/SimpleOCR/Bin/SimpleOCR.exe


Tuloksen jälki oli rehellisesti vaatimaton. Ohjelmaan saa ilmeisesti vain vieraskielisen sanastotuen (kiitos suljetun koodin) eikä sitä ole käännetty suomeksi (kiitos suljetun koodi). Se ei myöskään tunne kuin muutaman kuvaformaatin ja niihinkin tiedostotarkenteen windows tyyliin (kiitos suljetun koodin)