Ubuntu Suomen keskustelualueet

Ubuntun käyttö => Multimedia ja grafiikka => Aiheen aloitti: fossiili - 17.09.12 - klo:14.30

Otsikko: Miten teksti paperilta tiedostoksi?
Kirjoitti: fossiili - 17.09.12 - klo:14.30
Yritin viritellä systerin vanhaa WindowsXP:tä ja jotenkin sähläsin hänen muistelmiensa ensimmäisen dokumentin hukkaan. Se on kuitenkin printattuna laaserilla.

Systerillä on skanneri ja sillä dokumentin saa skannattua kuvatiedostoksi. Muistelen, että on ohjelmia, jotka tunnistavat kuvasta kirjaimet esimerkiksi laaserin printtaamat selvät fontit. Luovat kuvasta tekstitiedoston. Mitä sellaisia on:
1. Ubuntuun tai muihin Linuxiin?
2. Windows-versioihin?

En yhtäkkiä keksi tai muista ohjelmien nimiä, joten olen kiitollinen vinkeistä  ???
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: Taro Turtiainen - 17.09.12 - klo:15.15
Linuxille löytyy ainakin OCRFeeder.
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: jussi1960 - 17.09.12 - klo:15.26
OCR-ohjelmilla onnistuu, Optical character recognition on lyhenteen merkitys. Käyttelin kauan sitten OmniPage-merkkistä OCR:ää ja se toimi hyvälaatuisen paperitulosteen kanssa aika hyvin.

Muistaakseni joidenkin skannereiden mukana tulee merkintunnistussoftia. Onkohan netissä palvelua, jonne sopivassa pikseliformatissa oleva tiedosto voidaan lähettää ja saadaan palautteena tekstitiedosto?

Jussi
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: New_user - 18.09.12 - klo:18.54
OCR-ohjelmilla onnistuu, Optical character recognition on lyhenteen merkitys. Käyttelin kauan sitten OmniPage-merkkistä OCR:ää ja se toimi hyvälaatuisen paperitulosteen kanssa aika hyvin.

Muistaakseni joidenkin skannereiden mukana tulee merkintunnistussoftia. Onkohan netissä palvelua, jonne sopivassa pikseliformatissa oleva tiedosto voidaan lähettää ja saadaan palautteena tekstitiedosto?

Jussi

HP:lla on skanneriensa mukana, tai ainakin oli muutama vuosi sitten tosi hyvä OCR-ohjelma, olikohan se lisensioitu OmniPage tms. Mitään erillistä ei tarvinnut asentaa, vain skannerin softa, jolla sai suoraan valita, luetaanko tekstiä. Muistaakseni piti jostain asetuksista laittaa kielivalinta tms. oiken, niin ääkkösetkin tulivat ihan puhtaasti. Skanneri on vieläkin töissä ja toimii.
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: SuperOscar - 18.09.12 - klo:19.46
Pelkkiä kuvanlukuohjelmia Linuxiin kyllä löytyy, OCR on vielä vähän ongelma. Tesseract ja muut häviävät turhan selkeästi kaupalliselle tarjonnalle, joka taas ei Linuxiin ulotu.

Aivan ylivoimaisesti paras OCR-ohjelma on ABBYY FineReader Pro (http://finereader.abbyy.com/), mutta siitä ei ole Linuxiin käyttöliittymällistä versiota. OCR-moottori (http://www.abbyy.com/ocr_sdk/) kyllä löytyy jos haluaa vaikeimman kautta vääntää tai osaa ohjelmoida  ::)

Jos ilmaista ja Linuxissa toimivaa haluaa, muistaakseni joku joskus väitti, että Google Docs (https://docs.google.com/) toimisi verkossa varsin hyvin.
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: JarTak - 18.09.12 - klo:22.23
Ääni google docsille. Ottaa vaikka valokuvan jonka muuttaa pdf tiedostoksi. Sen jälkeen navigoi googlelle ja lataa koneelta tiedoston sinne ja...VOILA!
Otsikko: Vs: Miten teksti paperilta tiedostoksi?
Kirjoitti: qwertyy - 18.09.12 - klo:22.27
Pitääpäs kokeilla jossain välissä Googlea. Olen kyllä Driveä käyttänyt, mutta en ole edes sattunut huomaan, että siellä tosiaan on tuollainen toiminto. Kiitoksia vinkistä.