Ubuntu Suomen keskustelualueet
Ubuntun käyttö => Multimedia ja grafiikka => Aiheen aloitti: fossiili - 17.09.12 - klo:14.30
-
Yritin viritellä systerin vanhaa WindowsXP:tä ja jotenkin sähläsin hänen muistelmiensa ensimmäisen dokumentin hukkaan. Se on kuitenkin printattuna laaserilla.
Systerillä on skanneri ja sillä dokumentin saa skannattua kuvatiedostoksi. Muistelen, että on ohjelmia, jotka tunnistavat kuvasta kirjaimet esimerkiksi laaserin printtaamat selvät fontit. Luovat kuvasta tekstitiedoston. Mitä sellaisia on:
1. Ubuntuun tai muihin Linuxiin?
2. Windows-versioihin?
En yhtäkkiä keksi tai muista ohjelmien nimiä, joten olen kiitollinen vinkeistä ???
-
Linuxille löytyy ainakin OCRFeeder.
-
OCR-ohjelmilla onnistuu, Optical character recognition on lyhenteen merkitys. Käyttelin kauan sitten OmniPage-merkkistä OCR:ää ja se toimi hyvälaatuisen paperitulosteen kanssa aika hyvin.
Muistaakseni joidenkin skannereiden mukana tulee merkintunnistussoftia. Onkohan netissä palvelua, jonne sopivassa pikseliformatissa oleva tiedosto voidaan lähettää ja saadaan palautteena tekstitiedosto?
Jussi
-
OCR-ohjelmilla onnistuu, Optical character recognition on lyhenteen merkitys. Käyttelin kauan sitten OmniPage-merkkistä OCR:ää ja se toimi hyvälaatuisen paperitulosteen kanssa aika hyvin.
Muistaakseni joidenkin skannereiden mukana tulee merkintunnistussoftia. Onkohan netissä palvelua, jonne sopivassa pikseliformatissa oleva tiedosto voidaan lähettää ja saadaan palautteena tekstitiedosto?
Jussi
HP:lla on skanneriensa mukana, tai ainakin oli muutama vuosi sitten tosi hyvä OCR-ohjelma, olikohan se lisensioitu OmniPage tms. Mitään erillistä ei tarvinnut asentaa, vain skannerin softa, jolla sai suoraan valita, luetaanko tekstiä. Muistaakseni piti jostain asetuksista laittaa kielivalinta tms. oiken, niin ääkkösetkin tulivat ihan puhtaasti. Skanneri on vieläkin töissä ja toimii.
-
Pelkkiä kuvanlukuohjelmia Linuxiin kyllä löytyy, OCR on vielä vähän ongelma. Tesseract ja muut häviävät turhan selkeästi kaupalliselle tarjonnalle, joka taas ei Linuxiin ulotu.
Aivan ylivoimaisesti paras OCR-ohjelma on ABBYY FineReader Pro (http://finereader.abbyy.com/), mutta siitä ei ole Linuxiin käyttöliittymällistä versiota. OCR-moottori (http://www.abbyy.com/ocr_sdk/) kyllä löytyy jos haluaa vaikeimman kautta vääntää tai osaa ohjelmoida ::)
Jos ilmaista ja Linuxissa toimivaa haluaa, muistaakseni joku joskus väitti, että Google Docs (https://docs.google.com/) toimisi verkossa varsin hyvin.
-
Ääni google docsille. Ottaa vaikka valokuvan jonka muuttaa pdf tiedostoksi. Sen jälkeen navigoi googlelle ja lataa koneelta tiedoston sinne ja...VOILA!
-
Pitääpäs kokeilla jossain välissä Googlea. Olen kyllä Driveä käyttänyt, mutta en ole edes sattunut huomaan, että siellä tosiaan on tuollainen toiminto. Kiitoksia vinkistä.