Näytä kirjoitukset

Tässä osiossa voit tarkastella kaikkia tämän jäsenen viestejä. Huomaa, että näet viestit vain niiltä alueilta, joihin sinulla on pääsy.


Aiheet - Aum

Sivuja: [1]
1

Tesseract on erittäin lupaava tekstintunnistus, eli OCR (Optical Character Recognition) projekti. Projekti on alunperin HP:n vuosina 1985-1995 kehittämä ja sittemin googlen tukemaksi opensource-projektiksi siirtynyt systeemi. Tällä hetkellä se on paras saatavilla olevista opensource OCR vaihtoehdoista, mutta siihen sopivat käyttöliittymät puuttuvat vielä suurilta osin.  OCRopus (viimeisin versio 0.3.1) pyrkii täydentämään tätä aukkoa.

Kielituki löytyy tällä hetkellä seuraaville: englanti, ranska, italia, saksa, espanja ja hollanti. Olisi hienoa saada tähän opensource OCR-softaan suomenkielen tuki mukaan.

Tesseract OCR
http://code.google.com/p/tesseract-ocr/

OCRopus
http://code.google.com/p/ocropus/

2
Olisi tarve saada suomenkielinen oikoluku evolutioniin. Selailin täältä foorumilta vanhoja viestejä, ja ainakin pari vuotta sitten tilanne näytti olevan se, ettei evolutioon soikkoa saa toimimaan. Onko asiassa tapahtunut kehitystä? Joko on olemassa jokin gnome-spell-soikko -paketti?

3
Tervehdys,

Jostain syystä locale-asetukseni ovat vaihtuneet jenkkiläisiksi. Vaihdoin ne jo kerran täällä foorumilla olevien ohjeiden avulla suomalaisiksi ja ajamalla dpkg-reconfigure locales. Tuolloin locale -komennon tuloste oli odotetun suomalainen. Nyt kuitenkin jostain syystä tilanne on bootin jälkeen palannut jenkkiläiseksi. Mistä ihmeestä tuo locale-asetus oikein kumpuaa ja minne se tulee asettaa, jotta asetus myös pysyy? Hiukka ikävää käydä erikseen ennen jokaista printtiä käydä muuttamassa paperikoko A4:ksi jokaisessa sovelluksessa erikseen..

$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

Sivuja: [1]