Näytä kirjoitukset

Tässä osiossa voit tarkastella kaikkia tämän jäsenen viestejä. Huomaa, että näet viestit vain niiltä alueilta, joihin sinulla on pääsy.


Viestit - Aum

Sivuja: [1]
1

Tesseract on erittäin lupaava tekstintunnistus, eli OCR (Optical Character Recognition) projekti. Projekti on alunperin HP:n vuosina 1985-1995 kehittämä ja sittemin googlen tukemaksi opensource-projektiksi siirtynyt systeemi. Tällä hetkellä se on paras saatavilla olevista opensource OCR vaihtoehdoista, mutta siihen sopivat käyttöliittymät puuttuvat vielä suurilta osin.  OCRopus (viimeisin versio 0.3.1) pyrkii täydentämään tätä aukkoa.

Kielituki löytyy tällä hetkellä seuraaville: englanti, ranska, italia, saksa, espanja ja hollanti. Olisi hienoa saada tähän opensource OCR-softaan suomenkielen tuki mukaan.

Tesseract OCR
http://code.google.com/p/tesseract-ocr/

OCRopus
http://code.google.com/p/ocropus/

2
Pikainen Google-haku toi Ubuntun/Debianin osalta esille tämän viestiketjun, Timo itse varmaan osaa kertoa tarkemminkin: http://groups.google.se/group/linux.debian.bugs.dist/browse_thread/thread/ac9c63239c92240e/cb95c5a12c46d2ec?lnk=raot
[/quote]

Huomaan että tuolla viimeisin viesti on päivätty 4.5.2008, eli siis eilen. Asia näyttää siis olevan kovin tuore. Toivotaan, että myös tuloksia alkaa näkyä piakkoin, siihen asti oikoluettakoon käsin.

3
Olisi tarve saada suomenkielinen oikoluku evolutioniin. Selailin täältä foorumilta vanhoja viestejä, ja ainakin pari vuotta sitten tilanne näytti olevan se, ettei evolutioon soikkoa saa toimimaan. Onko asiassa tapahtunut kehitystä? Joko on olemassa jokin gnome-spell-soikko -paketti?

4
Jepp, toi näppisvika oli siis vain hetkellinen, X:n restart korjasi senkin ongelman. Nyt on locale ihan kohdallaan, yhtä pientä juttua lukuunottamatta: Gnome-login -ruudussa näppiksenä on jenkkinäppis suomalaisen sijasta. Mikä lie tuohon vaikuttaa? Katsoin Järjestelmä/ylläpito/kirjautumisikkuna, muttei siellä ollut mitään

Alla nykyinen locale:
Koodia: [Valitse]
LANG=en_US.UTF-8
LC_CTYPE=fi_FI.UTF-8
LC_NUMERIC=fi_FI.UTF-8
LC_TIME=fi_FI.UTF-8
LC_COLLATE=fi_FI.UTF-8
LC_MONETARY=fi_FI.UTF-8
LC_MESSAGES=fi_FI.UTF-8
LC_PAPER=fi_FI.UTF-8
LC_NAME=fi_FI.UTF-8
LC_ADDRESS=fi_FI.UTF-8
LC_TELEPHONE=fi_FI.UTF-8
LC_MEASUREMENT=fi_FI.UTF-8
LC_IDENTIFICATION=fi_FI.UTF-8
LC_ALL=

5
Bootin jalkeen - Nyt on locale kohdallaan, mutta:
-Gnomen kaynnistyessa herja: Gnomen asetusdemonin kaynnistys epaonnistui (en viela ole kaynnistanyt gnomea uudelleen)
-Nappaimistona on englanti, eika skandit toimi nappiksella

alla locale
~$ locale
LANG=en_US.UTF-8
LC_CTYPE=fi_FI.UTF-8
LC_NUMERIC=fi_FI.UTF-8
LC_TIME=fi_FI.UTF-8
LC_COLLATE=fi_FI.UTF-8
LC_MONETARY=fi_FI.UTF-8
LC_MESSAGES=fi_FI.UTF-8
LC_PAPER=fi_FI.UTF-8
LC_NAME=fi_FI.UTF-8
LC_ADDRESS=fi_FI.UTF-8
LC_TELEPHONE=fi_FI.UTF-8
LC_MEASUREMENT=fi_FI.UTF-8
LC_IDENTIFICATION=fi_FI.UTF-8
LC_ALL=

6
Tässäpä oikeanlainen valikko, sinulta puuttuu pari riviä

Koodia: [Valitse]
LANG=fi_FI.UTF-8
LC_CTYPE="fi_FI.UTF-8"
LC_NUMERIC="fi_FI.UTF-8"
LC_TIME="fi_FI.UTF-8"
LC_COLLATE="fi_FI.UTF-8"
LC_MONETARY="fi_FI.UTF-8"
LC_MESSAGES="fi_FI.UTF-8"
LC_PAPER="fi_FI.UTF-8"
LC_NAME="fi_FI.UTF-8"
LC_ADDRESS="fi_FI.UTF-8"
LC_TELEPHONE="fi_FI.UTF-8"
LC_MEASUREMENT="fi_FI.UTF-8"
LC_IDENTIFICATION="fi_FI.UTF-8"
LC_ALL=

Ps: Suomi oletuksena kieliasetuksissa(oletus Suomi ) ei riitä pitää ruksittaa myös vetovalikosta Suomi, valmiina on viiva,pitää olla kunnon väkänen.

System/preferences/language:ssa oli väkänen, eikä pelkkä viiva. No otin pois ja laitoin uudelleen -> kirjoitti /etc/default/locale -filen uusiksi, ja poisti sieltä kaiken ylimääräisen jättäen vain LANG ja LANGUAGE -riveille fi_FI.UTF-8. Muokkasin sitten ja lisäsin antamasi rivit. Kokeilen seuraavaksi josko homma olisi alkanut pelittämään. Ilmoittelen tänne, nyt reboot.

7
Ups.. Voit lisätä /boot/grub/menu.lst tiedostoon oletus-asetuksiin locale.fi_FI asetuksen jolloin pitäisi astua voimaan

Höh? Tuo kuullostaa kyllä kovin omituiselta paikalta määritellä locale.. Ehkä kokeilen sitä jos ei muu auta. Mutta miksi se siellä pitäisi määritellä? Nyt on  kysymyksenä se, että mistä ihmeestä tuo väärä määritys tulee, ja miksei määrittelemän suomalaiset lokaaliasetukset ole voimassa.

Alla vielä /etc/default/locale:n sisältö:
Koodia: [Valitse]
$ cat /etc/default/locale
LANG="fi_FI.UTF-8"
LANGUAGE="fi_FI:fi:en_GB:en"

8
Olen puhunut kokoajan localesta, enkä language -asetuksesta. Ks. tämän ketjun ensimmäinen viesti.

Eli ongelmasi koskee tulostusta, ei niinkään kieliasetuksia.

Tuohon ongelmaan joku tulostukseen perehtynyt osaa auttaa. Koskaan en ole eläissäni mitään tulostanut :)
Kerran tai kaksi käyttänyt kopiokonetta.

Olen määritellyt /etc/environment -tiedostoon asiat haluamallani tavalla tämän mukaisesti , mutta jostain syystä juttu ei toteudu haluni mukaisesti vaan asetukset höylätään yli jostain. Alla /etc/environment -tiedoston sisältö:

Koodia: [Valitse]
$ cat /etc/environment
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games"

LC_MESSAGES="en_DK.UTF-8" # language
LANG="en_DK.UTF-8"      # fallback if LC_specific not set
LC_PAPER="fi_FI.UTF-8"   # a4, can't print without this
LC_MEASUREMENT="fi_FI.UTF-8" # metric system
LC_NUMERIC="fi_FI.UTF-8" # 100 000,02 fi keyboard numpad has comma not dot
LC_MONETARY="fi_FI.UTF-8" # EUR
LC_TIME="en_DK.UTF-8"   # iso-8601, 24h + weeks start Mon + format yyyy-mm-dd HH:MM
LC_CTYPE="fi_FI.UTF-8"  # which characters are letter
LC_COLLATE="fi_FI.UTF-8" # sort order, eg. a" ä is after z
LC_NAME="fi_FI.UTF-8"
LC_ADDRESS="fi_FI.UTF-8"
LC_TELEPHONE="fi_FI.UTF-8"
LANGUAGE="fi_FI:fi:en_GB:en"

Olen myös tsekannut tiedostot .profile, jossa ei ole mitään, .bashrc, jossa ei locale määrityksiä ole, sekä myös .bash_profile, jota ei kotihakemistossani ole.

Mistä ihmeestä ubuntun locale määritellään?

9
Valikko->Järjestelmä->Ylläpito->Kieliasetukset
Tuolta voi aloittaa.

Tuolla on kaikki kohdallaan. Oletuskielenä suomi, sen lisäksi listalta valittuna englanti, hollanti, ruotsi, hindi. Tämä ei kuitenkaan ole kohta, jossa valitaan maa-asetukset. Täältä valitaan ladattavat kielipaketit, jotka ovat ihan kohdallaan ja oikein. Nyt kusee siis paperikoko (on letter vaikka pitäisi olla A4), mittayksikkö (on tuuma millimetrien sijaan), päivämäärä (on amerikkalaista muotoa), jne.

10
Homma toimii jos käytän seuraavaa:
Koodia: [Valitse]
echo `cat testi.txt` > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2 mutta olisi mukavaa saada tuo skripti toimimaan suoraan. Miksi putkitus kusee tässä?
Kusee varmaan, koska tossa on toi toinen ohjaus. Jaa-ah, en pääse nyt testailemaan, mut jos toimii noin niin eiks se oo ihan hyvä? ;D
Olisi mukava saada yksi komento jonka perään heittää parametriksi tekstitiedoston nimi.

Oikeestaan tämä on niin mahtava juttu, että hommaa voisi kehittää siten, että skriptille voisi tarjota txt tiedoston lisäksi .doc, .pdf ja .odt tiedostoja - ja miksei muitakin formaatteja. Lähdetiedoston voi lukea sopivalla ohjelmalla, kuten antiword, pdftotext, odt2txt, ps2txt jne, tulosteen taas syöttää tuolle lue skriptille. Jos tällaisen saisi tuotettua, olisi mukava pyöräyttää tuo skripti vaikka nautiluksessa right-clickillä, ja kuunnella pdf-dokumentti samalla kun tiskaa astioita..

11

Komennon nimi on /bin/sanon?
Kokeiles sanon < /home/user/puhe.txt
[/quote]

sanon on oikea komento. Teknisesti tuon antamasi pitäisi toimia, mutta ei edelleenkään puhu eikä pukahda.

Homma toimii jos käytän seuraavaa:
Koodia: [Valitse]
echo `cat testi.txt` > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2 mutta olisi mukavaa saada tuo skripti toimimaan suoraan. Miksi putkitus kusee tässä?

12
Joskus aikaisemmin sain jo tämän toimimaan, mutta nyt muutamien päivitysten jälkeen ei enää juttele eikä puhele.

Bootti ratkaisi ongelman.

Onko mahdollista putkittaa tekstitiedoston tulostetta tuon sano -skriptin syötteeksi? Kokeilin seuraavia, eivätkä toimineet:
 /bin/sanon `cat /home/user/puhe.txt`
cat /home/user/puhe.txt | /bin/sanon

13
Joskus aikaisemmin sain jo tämän toimimaan, mutta nyt muutamien päivitysten jälkeen ei enää juttele eikä puhele. Näköjään mpg123 toimii jos kutsuu sitä komennolla "aoss mpg123".

Tässä tuloste:
$ echo päivää > /tmp/ttv && iconv -f UTF-8 -t ISO8859-1 /tmp/ttv > /tmp/ttv2 &&festival --tts /tmp/ttv2
Linux: can't open /dev/dsp
SIOD ERROR: damaged env : #<UNKNOWN 12 0xb7162068>

14
Tervehdys,

Jostain syystä locale-asetukseni ovat vaihtuneet jenkkiläisiksi. Vaihdoin ne jo kerran täällä foorumilla olevien ohjeiden avulla suomalaisiksi ja ajamalla dpkg-reconfigure locales. Tuolloin locale -komennon tuloste oli odotetun suomalainen. Nyt kuitenkin jostain syystä tilanne on bootin jälkeen palannut jenkkiläiseksi. Mistä ihmeestä tuo locale-asetus oikein kumpuaa ja minne se tulee asettaa, jotta asetus myös pysyy? Hiukka ikävää käydä erikseen ennen jokaista printtiä käydä muuttamassa paperikoko A4:ksi jokaisessa sovelluksessa erikseen..

$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

15
Kyseisen suomalaisen miesäänen saa kyllä toimimaan gnomessa orca ohjelman avulla :

Orca on ruudunlukija. en keksinyt millään kuinka sen saisi lukemaan esim haluamani uutisen ylen nettisivuilta tai sopivan pätkän tekstiasiakirjasta. Orca lukee kyllä kaikki valikot ym, mutta ei varsinaista tekstiä. Teenkö jotain väärin?

16
Oppaiden kehittäminen / Vs: Ubuntu puhumaan suomea
« : 06.05.07 - klo:21.27 »
Ubuntun saa aika helposti tuottamaan suomenkielistä puhetta äänikortin kautta.

Sain noiden ohjeiden homman pelittämään, kiitokset jikulle.
Kätevä fala text reader for gnome toimii loistavasti, mutta ääkköset tulee ulos muodossa "viiva tuntematon merkki". Jos taas käytän "sano" -skriptiä, ääkköset tulee aivan oikein. Saako festivalin jotenkin ymmärtämään UTF-8 skandeja ohjelman tasolla, siten että esim fala ja muut festivalia hyödyntävät ohjelmat osaisivat käsitellä ääkkösiä oikein?

Sivuja: [1]