1
Yleistä keskustelua / Tekstintunnistus Linuxissa kehittyy - Tesseract OCR 2.03 julkaistu
« : 13.01.09 - klo:18.28 »Tesseract on erittäin lupaava tekstintunnistus, eli OCR (Optical Character Recognition) projekti. Projekti on alunperin HP:n vuosina 1985-1995 kehittämä ja sittemin googlen tukemaksi opensource-projektiksi siirtynyt systeemi. Tällä hetkellä se on paras saatavilla olevista opensource OCR vaihtoehdoista, mutta siihen sopivat käyttöliittymät puuttuvat vielä suurilta osin. OCRopus (viimeisin versio 0.3.1) pyrkii täydentämään tätä aukkoa.
Kielituki löytyy tällä hetkellä seuraaville: englanti, ranska, italia, saksa, espanja ja hollanti. Olisi hienoa saada tähän opensource OCR-softaan suomenkielen tuki mukaan.
Tesseract OCR
http://code.google.com/p/tesseract-ocr/
OCRopus
http://code.google.com/p/ocropus/