Kirjoittaja Aihe: Suomenkielinen malli - F5-TTS  (Luettu 6675 kertaa)

asmokosk

  • Käyttäjä
  • Viestejä: 2
    • Profiili
Suomenkielinen malli - F5-TTS
« : 25.12.24 - klo:13.17 »

Tein muutamia viikkoja sitten suomenkieliseen äänimallin F5-TTS -ohjelmistolle.

https://github.com/SWivid/F5-TTS/blob/main/src/f5_tts/infer/SHARED.md

https://huggingface.co/AsmoKoskinen/F5-TTS_Finnish_Model

Käytin vapaasti saatavilla olevia suomenkielisiä äänitiedostoja alkuperäisen mallin hienosäätämiseen: Common Voice, LibriVox ja Vox Populi.

Katso varsinainen asennus GitHubista:

https://github.com/SWivid/F5-TTS

Ystävällisin terveisin Asmo Koskinen.

asmokosk

  • Käyttäjä
  • Viestejä: 2
    • Profiili
Vs: Suomenkielinen malli - F5-TTS
« Vastaus #1 : 16.02.25 - klo:17.59 »
Piper-projektissa on jo Harri. Piper-ohjelmaa voi käyttää esimerkiksi Raspberry Pi:ssä.

Käytin omaa ääntäni (kloonaus) ja loin synteettisen datasetin Piperia varten.

Käytin tuota datasettiä luodakseni tyhjästä tarkistuspisteen (epoch=1999-step=288000.ckpt) ja sitten onnx-tiedoston (fi_FI-asmo-medium.onnx).

Voit lukea lisää täältä, kuuntele Piper-projektin äänitiedostot testausta varten:

https://huggingface.co/AsmoKoskinen/Piper_Finnish_Model

Suomalaisen F5-TTS-mallin osalta käytin Creative Commons Attribution Non Commercial 4.0 -lisenssiä. Ja siksi käytän Creative Commons Attribution Non Commercial 4.0 -lisenssiä myös tässä mallissa.

Katso varsinainen asennus GitHubista:

https://github.com/rhasspy/piper

Voit käyttää myös Piper Studiota oman datasetin äänittämiseen:

https://github.com/rhasspy/piper-recording-studio

Ystävällisin terveisin Asmo Koskinen.
« Viimeksi muokattu: 18.02.25 - klo:10.41 kirjoittanut asmokosk »