Kirjoittaja Aihe: Tekstin esiinsaaminen kuvasta  (Luettu 5442 kertaa)

Pendeli

  • Käyttäjä
  • Viestejä: 829
    • Profiili
Tekstin esiinsaaminen kuvasta
« : 01.04.22 - klo:16.24 »
Minulla on netistä ladattu kuva missä teksti on juuri ja juuri rajoilla että siitä saisi selvää.
Kuvaa suurentamalla kuva tietysti leviää pikseleiksi eikä teksti siitä selkene ollenkaan luettavaksi.

Onko mitään keinoa muokata kuvaa niin että teksti tulisi luettavaksi?
Ennenkuin rupean Gimpin tjm. kanssa vääntämään, niin olisi kiva tietää jo etukäteen, että onnistuuko tuollainen ollenkaan ettei turhaa tuhlaa aikaa mahdottomaan.

nm

  • Käyttäjä
  • Viestejä: 16232
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #1 : 01.04.22 - klo:16.34 »
Ihan ensin kannattaa varmistaa, olisiko kuvasta jossain saatavilla parempi versio. Joissain tapauksissa se voi olla ladattavissa jopa samalta nettisivustolta eri parametreilla tai tiedostonimellä.

Jos parempaa ei ole olemassa, OCR-sovelluksella voisi teoriassa olla mahdollista lukea kuvan teksti tekstimuotoon, mutta jos laatu on niin huono, että tekstiä on ihmisen vaikea tulkita, geneerinen OCR ei ehkä tuota mitään järkevää. Silloin ratkaisuksi jää tekstin uudelleenkirjoittaminen suurennettuun kuvaan esimerkiksi Gimpillä.

jarmala

  • Käyttäjä
  • Viestejä: 773
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #2 : 01.04.22 - klo:21.39 »
Minulla on netistä ladattu kuva missä teksti on juuri ja juuri rajoilla että siitä saisi selvää.
Kuvaa suurentamalla kuva tietysti leviää pikseleiksi eikä teksti siitä selkene ollenkaan luettavaksi.

Kontrastia, gammaa ja kirkkautta sopivasti säätämällä teksti saattaa tulla lukukelpoiseksi.
Ubuntu 18.04 LTS, Gnome Flashback Metacity, Xeon E3-1245 V2, 8 GB
Ubuntu 22.04 LTS, KDE Plasma, Celeron N5105, 8 GB

Roberto

  • Käyttäjä
  • Viestejä: 174
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #3 : 19.11.22 - klo:10.37 »
Vanha ketju mutta kommentoin vielä jos siitä olisi apua jollekin.
Olen parannellut vanhoja kuvia Upscaler ohjelmalla.
Lopputulos on yleensä vähintäänkin hämmästyttävä.

https://www.omgubuntu.co.uk/2022/11/upscaler-open-source-ai-image-upscale-app-for-linux

flatpak versio on käytössä.
Koodia: [Valitse]
flatpak install flathub io.gitlab.theevilskeleton.Upscaler
Dell OptiPlex 7470 (All in One), i5-9500T (6) @ 4,400GHz, 32 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Dell OptiPlex 7440 (All in One), i5-6500  (4) @ 3.600GHz, 16 GiB DDR4, Samsung 970 EVO Plus (M.2 2280) 500 Gt
Jäähyllä olevat: Amiga 500, C64

Jere Sumell

  • Käyttäjä
  • Viestejä: 721
  • Talous, Hallinto ja Markkinointi (AMK, 2017),B.B.A
    • Profiili
    • Tietokone-blogi
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #4 : 26.11.22 - klo:16.25 »
Kuva on ilmeisesti bittikartta-muodossa? Vektorigrafiikka siinä mielessä järkevämpää, ja käsittääkseni myös .PNG -tiedostomuotoinen kuva, että se skaalautuu oikein se kuvalähteen sisältö, jos kokoa muuttaa, mutta bittikartta-muotoisen kuvan kanssa on ongelmia.

On se ihan totta, että jos tuo on bittikartta-kuva ja huono resoluutio, niin paskasta ei saa konvehtia.
Free Internet and  people for humans all over the globe!

(Profiilikuvassa oma valokuvani GIMPissä editoituna Disney Classic-väripaletin väreihin ja muunnettuna bittikartta-tiedostosta vektorigrafiikaksi.)

kamara

  • Käyttäjä
  • Viestejä: 2944
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #5 : 26.11.22 - klo:19.36 »
Kuva on ilmeisesti bittikartta-muodossa? Vektorigrafiikka siinä mielessä järkevämpää, ja käsittääkseni myös .PNG -tiedostomuotoinen kuva, että se skaalautuu oikein se kuvalähteen sisältö, jos kokoa muuttaa, mutta bittikartta-muotoisen kuvan kanssa on ongelmia.

Kyllä PNG on pistematriisikuva, mutta siitä pystyy tekemään kuvan ennen kuin tiedosto on kokonaan ladattu koneen muistiin. Se johtuu siitä, että pisteet eivät ole yksinkertaisesti vasemmalta oikealle ja sieltä alas (tai vastaavasti alhaalta ylös vasemmalta oikealle). Vaan pisteiden järjestys menee aluksi kulmasta kulmaan, ja sieltä mahdollisimman tasaisesti, jotta raakakuva voidaan näyttää ennen kuin kaikki pisteet on ladattu palvelimelta/tiedostolta.

Jere Sumell

  • Käyttäjä
  • Viestejä: 721
  • Talous, Hallinto ja Markkinointi (AMK, 2017),B.B.A
    • Profiili
    • Tietokone-blogi
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #6 : 27.11.22 - klo:14.12 »
Hyvä, kun valaisit teknisillä yksityskohdilla tuota .png -kuvaformaatin toimintaa. En ole sitä vektorigrafiikkana koskaan pitänytkään, jotenkin epäselvästi liitin sen tuon vektorigrafiikan etujen jälkeen samaan virkkeeseen mitä ongelmia on näissä välimerkeissä ja liian pitkissä lauseissa näissä kirjoituksissani ennenkin saanut palautetta asiasta.

Kuulin joskus jonkun korkeakouluohjaajan toteavan .png -tiedostoformaatista, että silläkin on takanaan hurja tulevaisuus.

Vähän vaikuttaa tosiaan tuo kuvaformaatti, jossa kuva on tallennettu, kun GIMpissäkin on elementteinä tai kerroksissa eri kuvadata-sisältoä, ja jos ne elementtien ja kerrosten rakenteet tallentuu myos sen kuvan lopulliseen vedokseen viennin tai tallennuksen yhteydessä siinä kuvaformaatissa, jossa ulostulotiedosto on, niin sittenhän GIMpissä pystyy myos muokkaamaan aika vapaasti kuvan sisältoä ja kerrosten sisältoä ja tallentaa tai viedä se mihin tahansa sitten muuhunkin tiedostoformaatin muotoon.

Mutta pääsääntoisesti videokuvassakin sama, että maksimi on lopulta se alkuperäisen kuvan ominaisuudet ja laatu, mihin se voidaan muuntaa, että parannettua ei nyt yleensä ei laatua saa. Yhdysvalloissakin Hollywood-tuotannoissa kun tulee uusi elokuvaformaatti kotivideoihin, vielä kun niitäkin elokuvastudiot eivät enää kaikki niitäkään julkaise fyysisinä tuotteina, niin se alkuperäinen elokuvakamera, niin varmaan jo aika pitkään ne tallennetaan niissä kamerioissa raakana, RAW-Datana, ja sitten uuden formaatin fyysinen levy, kun tehdään siitä niin algoritmi vain vaihtuu, jolla se master-kopiosta se loppuvedos sitten he tekevät.

Noissakin Canonin ammattimaisissa Cinema EOS-videokameroissa puhutaan myyntipuheissa mahdollisuutena tallentaa ammattimaiseen 12-bittisenä RAW-muotoon melkein 3 Gb/s nopeudella sitä videokuvaa, mutta vaatii järkyttävän ison kokoisen muistikortin, jos haluaa kuvata edes joitain minuutteja ylipäätään yhteiskestoltaan videokuvaa tuossa formaatissa.
Free Internet and  people for humans all over the globe!

(Profiilikuvassa oma valokuvani GIMPissä editoituna Disney Classic-väripaletin väreihin ja muunnettuna bittikartta-tiedostosta vektorigrafiikaksi.)

Pendeli

  • Käyttäjä
  • Viestejä: 829
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #7 : 27.11.22 - klo:17.53 »
Vanha ketju mutta kommentoin vielä jos siitä olisi apua jollekin.
Olen parannellut vanhoja kuvia Upscaler ohjelmalla.
Lopputulos on yleensä vähintäänkin hämmästyttävä.

https://www.omgubuntu.co.uk/2022/11/upscaler-open-source-ai-image-upscale-app-for-linux

flatpak versio on käytössä.
Koodia: [Valitse]
flatpak install flathub io.gitlab.theevilskeleton.Upscaler

Kokeilin ohjelmaa. Kaikki näytti sujuvan hyvin siihen asti kun valmis kuva piti tallentaa.
Tuli ilmoitus:
Linkkiä ei voitu näyttää. Open URI portable is not available.

Netissä näkyy olevan paljon asian tiimoilta mutta en jaksaisi koko yötä hakea ratkaisua.
Jos joku tietää nopean keinon ongelmaan niin säästyisin itse vaivalta.

Jtkone

  • Käyttäjä
  • Viestejä: 876
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #8 : 28.11.22 - klo:07.11 »
Juu sama ongelma.
Itse kiersin tuon antamalla tallenuspaikaksi, siis esimerkiksi, ...Kuvat\ jokutiedosto.jpg

Pendeli

  • Käyttäjä
  • Viestejä: 829
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #9 : 28.11.22 - klo:11.12 »
Eri tallennuspaikkoja yritellyt  png ja jpg:nä tallentaa mutta ei tallennu mihinkään

Pendeli

  • Käyttäjä
  • Viestejä: 829
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #10 : 28.11.22 - klo:18.39 »
Vanha ketju mutta kommentoin vielä jos siitä olisi apua jollekin.
Olen parannellut vanhoja kuvia Upscaler ohjelmalla.
Lopputulos on yleensä vähintäänkin hämmästyttävä.

https://www.omgubuntu.co.uk/2022/11/upscaler-open-source-ai-image-upscale-app-for-linux

flatpak versio on käytössä.
Koodia: [Valitse]
flatpak install flathub io.gitlab.theevilskeleton.Upscaler

Jos lopputulos on vähintään hämmästyttävä, voisin lähettää sähköpostitse sinulle pienen kuvan selvennettäväksi. Tai kenelle hyvänsä joka saa  hyviä tuloksia Upscalerilla. En viitsi yksityisyyden suojan takia laittaa tänne julkisesti henkilötietoja sisältäviä  kuvia mutta anna osoite niin laitan postia tulemaan.
Vai laitanko yksityisviestinä foorumin kautta?

nm

  • Käyttäjä
  • Viestejä: 16232
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #11 : 28.11.22 - klo:19.11 »
Jos lopputulos on vähintään hämmästyttävä, voisin lähettää sähköpostitse sinulle pienen kuvan selvennettäväksi. Tai kenelle hyvänsä joka saa  hyviä tuloksia Upscalerilla. En viitsi yksityisyyden suojan takia laittaa tänne julkisesti henkilötietoja sisältäviä  kuvia mutta anna osoite niin laitan postia tulemaan.
Vai laitanko yksityisviestinä foorumin kautta?

Minäkin voisin huvin vuoksi vilkaista ja kokeilla joitain temppuja.

Jos kyseessä on epäselvän tekstin parantaminen, Real-ESRGANin (Upscaler) ja Stable Diffusionin tapaiset mallit eivät välttämättä toimi suoraan kovin hyvin, koska niitä ei ole opetettu tekstiaineistolla. Tilanne tulee kuitenkin muuttumaan lähitulevaisuudessa.

Pendeli

  • Käyttäjä
  • Viestejä: 829
    • Profiili
Vs: Tekstin esiinsaaminen kuvasta
« Vastaus #12 : 28.11.22 - klo:19.42 »
nm

Laitoin  viestin.