Kirjoittaja Aihe: AMD Ryzen jäätyy, vain resetti auttaa (Ratkaistu)  (Luettu 11210 kertaa)

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Kattelen uutta näytönohjainta vanhan Nvidia ohjaimen tilalle, joka hyytyy aina silloin tällöin jumittaen koko systeemin. Käytössä Debian 11.

Ehdolla olisi Verkkokaupan Radeon 6500 XT: https://www.verkkokauppa.com/fi/product/778162/Asus-DUAL-RX6500XT-O4G-naytonohjain mutta Verkkokauppa sanoo siitä, että
Lainaus
Huom! Tämä näytönohjain käyttää PCI-Express 4.0 x4-väylää (liitäntä x16). Emme suosittele tätä näytönohjainta kokoonpanoihin, joka ei tue PCI-Express 4.0 -väylää, koska edeltävien PCI-Express sukupolvien x4-väylä ei kaikissa peleissä tarjoa riittävästi kaistaa näytönohjaimen maksimaalisen suorityskyvyn saavuttamiseksi.

Emolevy on neljä vuotta vanha ASUSPrime B350-Plus ATX: https://www.dustin.fi/product/5011013449/prime-b350-plus?tab=specification jonka laajennuspaikoista mainitaan, että
Lainaus
1 x CPU, 1 x PCIe 2.0 x16 (x4 tila), 1 x PCIe 3.0 x16 (x16/x8 mode (with AMD Ryzen CPU), 2 x PCI, 2 x PCIe 2.0 x1, 4 x DIMM 288-nastainen, x8 mode (with AMD 7th Generation A-series/Athlon CPU))

Uskaltaisiko sen silti ostaa ja kun en näistä mitään tiedä, niin löytyykö vanhalta emolta paikka tällaiselle kortille?
« Viimeksi muokattu: 07.02.23 - klo:15.22 kirjoittanut igor_2 »

Tomin

  • Palvelimen ylläpitäjä
  • Käyttäjä / moderaattori+
  • Viestejä: 11481
    • Profiili
    • Tomin kotisivut
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #1 : 12.08.22 - klo:10.50 »
Kyllä tuo näytönohjain toimii emolevyssäsi, ainakin liitäntöjen puolesta. Emolevyn vanhempi PCI Express -standardi vain rajoittaa näytönohjaimen käytössä olevaa kaistanleveyttä, millä tässä tapauksessa on hieman vaikutusta maksimisuorituskykyyn. Käytännössä et varmastikaan huomaa kyseistä asiaa ellet sitten ole ostamassa näytönohjainta pelikäyttöön, jolloin tuo olisi muutenkin vähän kehno valinta.
Automaattinen allekirjoitus:
Lisäisitkö [RATKAISTU] ketjun ensimmäisen viestin aiheeseen ongelman ratkettua, kiitos.

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #2 : 12.08.22 - klo:11.04 »
Kattelen uutta näytönohjainta vanhan Nvidia ohjaimen tilalle, joka hyytyy aina silloin tällöin jumittaen koko systeemin. Käytössä Debian 11.

Tuo johtuu todennäköisemmin Nouveau-ajurista kuin näytönohjaimesta sinänsä. Nvidian suljetulla ajurilla toimii vakaammin.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #3 : 12.08.22 - klo:18.02 »
Juu, ei tule pelaamiseen. Lähinnä pelaamista on varmaankin kuvan käsittely satunnaisesti.

Luulisin, että mulla on käytössä nvidian poropietari-ajurit. Ainakin NVIDIA X Server Settings on asennettu ja root@igor-debian:~# lsmod | grep nvidia palauttaa:

Koodia: [Valitse]
nvidia_drm             69632  7
drm_kms_helper        274432  1 nvidia_drm
nvidia_modeset       1204224  16 nvidia_drm
nvidia              35385344  808 nvidia_modeset
drm                   618496  11 drm_kms_helper,nvidia,nvidia_drm

Kaatuilua, tai systeemien totaalista hyytymistä, esiintyy aika harvakseltaa. Ehkä pari kolme kertaa kuukaudessa tms. Jotenkin olen yhdistävinäni sen intuitiivisesti näytönohjaimee, mutta voihan se tietysti olla jotain muutakin. Emo on kuitenkin vanhahko, vaikka ei ikäloppu vielä olekaan.

Ideoita ongelman selvittelyksi vastaanotetaan suurella kiitollisuudella.

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #4 : 12.08.22 - klo:19.51 »
Suosittelen lämpimästi kuitenkin varmistamaan asian, ettei ala sitten pian harmittamaan myöhemmin. Itse ajaisin ensimmäisenä memtestin ainakin kerran läpi asti. Jos kaikki ok, niin sitten kokeilisin Passmark testiä, jolla saa kuormitettua konetta muuten. Eli varmistaisin, että kone napsahtaa jumiin vasta varmasi silloin, kun näytönohjainta kuormitetaan.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #5 : 12.08.22 - klo:21.31 »
Täytyy kokeilla ainakin se memtesti.

Mulla on muistikuva, että kone olisi jumahtanut vaikka se seisoo käyttämättä ilman, että mitään ihmeellisempää on käynnissä.

Tiedä sitten.

epiphone

  • Käyttäjä
  • Viestejä: 1112
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #6 : 12.08.22 - klo:21.33 »
Toimiiko sitten, jos ottaa näytönohjaimen ihan kokonaan fyysisesti pois? Jos emolevyllä on esim
 Intelin integroitu näytönohjain.
Kahvi on väkevin juomani

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #7 : 13.08.22 - klo:00.09 »
Täytyy kokeilla ainakin se memtesti.

Mulla on muistikuva, että kone olisi jumahtanut vaikka se seisoo käyttämättä ilman, että mitään ihmeellisempää on käynnissä.

Tiedä sitten.
Jos ihan työpöydällä jää jumiin, niin veikkaanpa, että vika ei ole näytönohjaimessa.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #8 : 13.08.22 - klo:07.16 »
Ei ole ohjainta emolla. Jotenkin uumoilen, että olisi nvidian ajureissa / gnomessa jotain yhteensopivuus-juttua. Sitä tietysti voisi kokeilla, että mitä sanoo, jos poistaa ne käytöstä ja ajaa vain Nouveau-ajureilla. Tämän ongelma on, että joutuu aika pitkään odottelemaan, ennen kun voi ajatella, että niillä toimisi.

Juu, kun jumittaa myös työpöydällä, niin vika voi olla muuallakin. Poweri voi kuuleman mukaan joskus aiheuttaa omia juttujaan, samoin emon viat. Powerissa pitäisi kyllä olla potkua, kun on muistaakseni 500w laite. Muistia tuli kuvahommien takia hankittua aika reippaasti, eli 16 gigaa. Jos muistitesti ei anna mitään, niin voisi kokeilla myös ottaa toisen kamman pois.

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #9 : 13.08.22 - klo:12.13 »
Jos muistitesti menee läpi, niin ei ole minusta mitään syytä kokeilla poistaa toista kampaa. Vika voi tosiaan olla myös itse emolevyllä tai powerissa, vaikka se olisi kovin ylimitoitettu. Aika paljon kuitenkin monenlaista kondensaattorivikaa yms. voi sattua.

Toki varmaan olet katsonut lokeja, ettei siellä heti näy mitään toistuvaa virheilmoitusta tms?

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #10 : 13.08.22 - klo:17.17 »
Toki varmaan olet katsonut lokeja, ettei siellä heti näy mitään toistuvaa virheilmoitusta tms?

Oikeastaan en. Noiden lokien ongelma minun tapauksessa on, että niissä tahtoo olla rivejä niin hitosti ja toinen toistaan kryptisempiä. Pitäisi googlata lähes joka rivi ja ihmetellä läpi. Asiantuntijalle varmast hyvä apu.

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #11 : 13.08.22 - klo:22.00 »
No aika helppo tapa on vain komentaa käynnistymisen jälkeen dmesg. Katsot viimeisen aikaleiman kohdan ja vaikka sanotaan jos järjestelmä pysyy tunnin päällä normaalissa käytössä, niin sen jälkeen teet komennon uudelleen. Jos tuon edellisen aikaleiman jälkeen on ilmestynyt reilusti uusia rivejä, niin pistä ne vaikka tähän ketjuun uutena kommenttina. Jos et kytkenyt esim. usb laitteita tai irrottanut niitä, niin rivejä ei pääsääntöisesti pitäisi ilmestyä lisää.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #12 : 14.08.22 - klo:08.51 »
No aika helppo tapa on vain komentaa käynnistymisen jälkeen dmesg.

Ok. Kun seuraava hyytyminen ilmenee, niin katsotaan, mitä komento osaa kertoa. Kiitti!

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #13 : 14.08.22 - klo:11.31 »
No aika helppo tapa on vain komentaa käynnistymisen jälkeen dmesg.

Ok. Kun seuraava hyytyminen ilmenee, niin katsotaan, mitä komento osaa kertoa. Kiitti!

Dmesg listaa vain kernelin ajonaikaisen lokin, eli viimeisimmän uudelleenkäynnistyksen jälkeen tulleet viestit. Sen kautta et näe, onko kaatumisen yhteydessä merkitty lokiin jotain. Sen sijaan järjestelmälokista voi lukea myös edellisten boottien tapahtumia:

Koodia: [Valitse]
journalctl --list-boots
Koodia: [Valitse]
journalctl -b-1
Toki kernelin loki kannattaa vilkaista myös uusimpien tapahtumien osalta, kuten qwertyy neuvoi. Siellä voi olla virheilmoituksia, joiden aiheuttaja lopulta kaataa koko järjestelmän.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #14 : 25.09.22 - klo:10.57 »
Onpa ihme juttu: Nyt kun odottaa, että kone jumisi ja pääsisi ottamaan niitä logeja, niin ei mitään ongelmaa. Mitään en ole tehnyt tai säätänyt. Päivitykset ajan harvakseltaan aina, kun uutta on tarjolla. Melko harvoinhan niitä tähän stableen tuleekin.

Voihan se olla, että on tullut joku päivitys joka on korjannut jotain. Piru tietää. Paitsi että nyt kun siitä kirjoittelee, niin varmasti aivan heti on jumit päällä  :D

jarmala

  • Käyttäjä
  • Viestejä: 790
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #15 : 25.09.22 - klo:18.58 »
Onpa ihme juttu: Nyt kun odottaa, että kone jumisi ja pääsisi ottamaan niitä logeja, niin ei mitään ongelmaa. Mitään en ole tehnyt tai säätänyt.

Tuo on aivan normaalia kaikessa tuotantotoiminnassa: hunningolla oleva toiminto tai prosessi paranee heti, kun sitä ruvetaan seuraamaan, vaikka mitään muuta ei tehtäisikään...
Ubuntu 18.04 LTS, Gnome Flashback Metacity, Xeon E3-1245 V2, 8 GB
Ubuntu 22.04 LTS, KDE Plasma, Celeron N5105, 8 GB

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #16 : 02.02.23 - klo:13.08 »
Oho, meni ensin väärään ketjuun.

Nyt paremmalla onnella.
======================


Moro,

hyytymisongelma on palannut.

Bootteja on joutunut tekemään nyt näin:
Koodia: [Valitse]
  b496578c066d4d71b5b9b942a1a948f2 Sun 2023-01-29 13:02:54 EET - Sun 2023-01-29 19:32:57 EET
  ca605c54a47949069635cfb06d9b09f6 Tue 2023-01-31 17:07:16 EET - Tue 2023-01-31 17:08:17 EET
  76e42146fc024c2d8cd03b9c550eef76 Wed 2023-02-01 20:06:01 EET - Wed 2023-02-01 20:12:29 EET
  9ce5696c8bd14652aaba88e9c8295ef8 Wed 2023-02-01 20:23:56 EET - Wed 2023-02-01 20:27:09 EET
  467a19f1bcaa4376a35cbc33dde4c787 Wed 2023-02-01 20:47:56 EET - Wed 2023-02-01 20:49:39 EET
  d43dc37b156a434ebbe39efb80f000b2 Thu 2023-02-02 09:10:52 EET - Thu 2023-02-02 09:13:30 EET

Nämä siis kaikki pakkobootteja.

Powerin olen vaihtanut viime viikolla 850W laitokseen, eli sähköä pitäisi riittää, kun käytössä ei ole mitään erityistä. Lämmöt sekä prosessorissa että näytönohjaimessa ei lähelläkään hälyttäviä. Prosessorissa pyörii siinä nafti 40 astetta ja näytönohjaimen Nvidian settings softa väittää olevan 50 astetta.

Näytönohjain on tämä https://www.io-tech.fi/artikkelit/testissa-nvidia-geforce-gtx-1650-super/ ja emona https://www.asus.com/fi/motherboards-components/motherboards/prime/prime-b350-plus/

Näytönohjain on paikassa PCIEX16_2, josta käsikirjassa sanotaan, että

Koodia: [Valitse]
When using PCI cards on shared slots, ensure that the drivers support “Share IRQ” or that
the cards do not need IRQ assignments. Otherwise, conflicts will arise between the two PCI
groups, making the system unstable and the card inoperable.

Mielestäni kortti on tuollaisessa jaetussa slotissa, mutta en ole aivan varma, kun en ihan ymmärrä manuaalin taulukkoa. Kuitenkin ohjaimen tiedoissa on maininta, että se olisi PCI-Express 3.0 väylän kortti. Mitä se sitten tarkoittaakaan.

Ajattelin seuraavaksi yrittää ottaa näytönohjaimen irti ja seurata tilannetta emolla olevalla näytönohjaimella. En muista mistä syystä aikanaan olen tämän kortin ostanut, mutta siellä se nyt kuitenkin on.

Niin, lokeja olen tutkinut ja minun taidoilla ei niistä löydy oikein yhtään mitään boottia edeltävältä ajalta. Ei kyllä sen jälkeenkään.

Herättääkö jotain ajatuksia?

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #17 : 02.02.23 - klo:16.38 »
Ajattelin seuraavaksi yrittää ottaa näytönohjaimen irti ja seurata tilannetta emolla olevalla näytönohjaimella. En muista mistä syystä aikanaan olen tämän kortin ostanut, mutta siellä se nyt kuitenkin on.

Joo, kannattaa kokeilla prosessorin integroidulla näytönohjaimella, jos sellainen on olemassa. Huomaa, että Prime B350-Plussan kanssa yhteensopivissa Ryzeneissa ei ole näytönohjainta.

Jos prosessori on ensimmäisen sukupolven Ryzen 1xxx, kaatuilu voi johtua sen virransäästöbugista (C6 state). Silloin kannattaa varmistaa ainakin, että bios eli UEFI firmware on päivitetty uusimpaan versioon, ja että prosessorin mikrokoodi on päivittynyt. Prosessorin mallin ja käytössä olevan mikrokoodin version voi tarkistaa komennolla:

Koodia: [Valitse]
grep 'stepping\|model\|microcode' /proc/cpuinfo
Seuraavaksi, jos firmikset ovat kunnossa, ja edelleen kaatuilee, kannattaa kokeilla GRUB-asetuksissa /etc/default/grub kernelin parametria:

Koodia: [Valitse]
GRUB_CMDLINE_LINUX="rcu_nocbs=0-15"
(Tässä 0-15 viittaa prosessorin säikeisiin indeksoituna nollasta lähtien. Jos prosessorissa on kahdeksan sijaan neljä ydintä, aseta arvoksi 0-7)

Muista ajaa perään update-grub, jotta muutokset menevät perille varsinaiseen grub.cfg-tiedostoon.

Lähteitä:
https://wiki.archlinux.org/title/Ryzen#Soft_lock_freezing
https://wiki.gentoo.org/wiki/Ryzen#Soft_freezes_on_1st_gen_Ryzen_7
https://madjam.dev/posts/first-gen-amd-ryzen-kernel-freeze-bug/
https://bugzilla.kernel.org/show_bug.cgi?id=196683


Minulla Ryzen 1700x on toiminut vakaasti Asus CROSSHAIR VI HERO -emolevyllä ilman virityksiä.
« Viimeksi muokattu: 02.02.23 - klo:16.59 kirjoittanut nm »

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #18 : 02.02.23 - klo:17.56 »
Huomaa, että Prime B350-Plussan kanssa yhteensopivissa Ryzeneissa ei ole näytönohjainta.

Niinpä näytti olevan. Yritin nimittäin ottaa käyttöön emon ohjaimen, mutta ei pihahtanutkaan. Muistin vasta jälkeen päin, että käytin ensin aika pitkään jotain vanhaa passiivi nvidian korttia. Eli ei onnistunut kokeilu ainakaan nyt heti. Täytyy kaivella, että jos se vanha passiivi olisi jossain testikoneessa jäljellä. Niitä on kaksikin kappaletta kaapin perällä.

Prosessori on AMD Ryzen 5 1600 Six-Core Processor

Tuo grep -kysely antaa:

Koodia: [Valitse]
igor@igor:~$ grep 'stepping\|model\|microcode' /proc/cpuinfo
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
model : 1
model name : AMD Ryzen 5 1600 Six-Core Processor
stepping : 1
microcode : 0x8001129
igor@igor:~$

Eli jos oikein tulkitsen, niin niitä olisi kait sitten 12, eli parametriksi pitäisi antaa 0-11?

Mihin tarkalleen ottaen tuo rimpsu pitäisi kirjoitta? Ilmeisesti voisi testata sitä antamalla bootissa komentorivin loppuun sen rcu_nocbs=0-15, mutta jos haluan sen sitten pysyvästi käyttöön.

igor_2

  • Käyttäjä
  • Viestejä: 768
    • Profiili
Vs: Radeon 6500 XT & ASUSPrime B350-Plus ATX
« Vastaus #19 : 02.02.23 - klo:18.29 »
Löysin muuten jo ohjeen, jonne tuo rcu_nocbs=0-11 parametri tällätään. Odottelen nyt seuraavaa pakkoboottia ja sen jälkeen muokkaan parametrin 0-11:sta. Eikö 11 ollut oikea lukema, kun säikeitä taisi olla yhteensä 12.