Kirjoittaja Aihe: Todennäköisen rautavian paikallistaminen [ratkaistu]  (Luettu 6236 kertaa)

tmv

  • Käyttäjä
  • Viestejä: 81
    • Profiili
Oireet ovat: kone kaatuu, eikä reagoi näppäimistön painalluksiin, vain reset tai virtanappi sammuttaa.

Miten voisin paikallistaa mistä vika johtuu? En /var/log tiedostoista löytänyt mitään ihmeelistä. Pitäisikö siellä olla?

- Muistit OK
- Näytönohjain OK (Otin pois ja menee emolevyn näyttiksellä)

Epäilen emolevyn kuumentumista, sillä ulkoisesti kokeilemalla siinä oleva jäähdytyselementti on huomattavan kuuma. Manuaalin mukaan elementin alla on Intel MCH G33 piiri. sensors näyttää lämmöt kuitenkin ok. Toisaalta epäilen sensorsin fuulaavaan lämpötiloja; prossun lämpötila tuskin on 19 astetta, se olisi jo huoneilmaa matalampi.

Asensin phoronix-test-suite ohjelman, mutta myönnän sen olevan liian kryptinen osaakseni sitä käyttää. Osaisko joku sanoa jotain pätevää testiä?

Emolevy: Asus P5K-VM
Prossu: Intel core2duo 2,66Ghz - ei kellotettu

Koodia: [Valitse]
$ sensors
CPU Temperature:    +19.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:     +42.0°C  (high = +45.0°C, crit = +95.0°C)

« Viimeksi muokattu: 21.08.18 - klo:20.44 kirjoittanut tmv »

LeHiX

  • Käyttäjä
  • Viestejä: 810
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #1 : 15.08.18 - klo:16.02 »
Oletko tutkinut fyysisesti onko CPUn tuuletin/jäähdytin kunnolla kiinni, itselläni Helmikuussa (2018) kone sanoi itsensä irti juuri kun olin päättänyt istua sen äärellä pitempään kun kaaduin pahasti pihalla :( No olin puhelimen varassa 5kk ja kun kyllästyin käytin konetta huollossa.

Vika oli että koneen CPUn jäähdyttimen pidikkeestä oli "ala" sakara (emolevy pystyssä koneessa) lohjennut ja jäähdytin vain roikkuin yläsakaran varassa ja jäähdyttimen "pasta" oli kuivunut ja lohkeillut, ei sekään kestä näköjään kymmentä (10) vuotta  ???, en tiedä kuinka kauan se on ollut rikki mutta muutin nykyiseen asuntoon toukokuussa 2017 :(
Lämmöt oli välillä 80C asti ja kone huusi kuin sumusireeni.

Sitä Jäähdyttimen pidikettä asentaessa niintä meni siis pari tärviölle kun uusikin lohkesi samasta kohtaa, hankin uuden (sain takuuseen vaikka oli käytetty, jostain koneesta irroitettu) luovutin ja vein huoltoon.
Nyt on paljon hiljaisempi ja viileämpi vaikka voisi olla hiljaisempi ja viileämpi :)

Koodia: [Valitse]
LeHiX@LeHiX:~$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage:      +1.04 V  (min =  +0.85 V, max =  +1.60 V)
 +3.3 Voltage:      +3.30 V  (min =  +2.97 V, max =  +3.63 V)
 +5 Voltage:        +4.92 V  (min =  +4.50 V, max =  +5.50 V)
 +12 Voltage:      +12.28 V  (min = +10.20 V, max = +13.80 V)
CPU FAN Speed:     2960 RPM  (min =  600 RPM, max = 7200 RPM)
CHASSIS FAN Speed:  906 RPM  (min =  600 RPM, max = 7200 RPM)
POWER FAN Speed:    877 RPM  (min =  600 RPM, max = 7200 RPM)
CPU Temperature:    +47.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:     +33.0°C  (high = +45.0°C, crit = +95.0°C)
« Viimeksi muokattu: 15.08.18 - klo:16.07 kirjoittanut LeHiX »
| Pros. AMD Phemon(tm) 9950 :) (4cores) | Emo: ASUS M3A78 | Mem 8GT
| x86_64, ubuntu xorg 22.04  | GeForce GTX 750 Ti/PC

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #2 : 15.08.18 - klo:20.39 »
Emolevy: Asus P5K-VM
Prossu: Intel core2duo 2,66Ghz - ei kellotettu

Koodia: [Valitse]
$ sensors
CPU Temperature:    +19.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:     +42.0°C  (high = +45.0°C, crit = +95.0°C)

19 astetta on tosiaan virheellinen lukema. Käytännössä prosessorin lämpötila on ilmajäähdytyksellä 40 asteen yläpuolella, ja kuormitettuna voi nousta 70 asteeseen.

Onko coretemp-moduuli ladattuna?

Koodia: [Valitse]
lsmod | grep coretemp
Kokeile ladata se ja tarkista sitten lämpötila uudelleen.

Koodia: [Valitse]
sudo modprobe coretemp
Koodia: [Valitse]
sensors

Kannattaa tosiaan tarkistaa prosessorin jäähdyttimen kiinnitys, puhtaus pölystä ja tuulettimen pyöriminen, eli että se oikeasti siirtää ilmaa.
Lisäksi tuon ikäisessä koneessa voi olla tarpeen vaihtaa jäähdyttimen ja prosessorin välissä oleva lämpötahna.

tmv

  • Käyttäjä
  • Viestejä: 81
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #3 : 16.08.18 - klo:09.21 »
Onko coretemp-moduuli ladattuna?

Näyttäisi olevan.

Koodia: [Valitse]
$ lsmod | grep coretemp
coretemp               16384  0

Kannattaa tosiaan tarkistaa prosessorin jäähdyttimen kiinnitys, puhtaus pölystä ja tuulettimen pyöriminen, eli että se oikeasti siirtää ilmaa.
Lisäksi tuon ikäisessä koneessa voi olla tarpeen vaihtaa jäähdyttimen ja prosessorin välissä oleva lämpötahna.

Voi olla, että pitää tarkistaa jäähdyttimien kiinnitykset ja piitahna, vaikka se on ollut "vasta" 5-vuotta siinä kiinni.
Laitoin siihen silloin kiinni uuden tuulettimen prossuun - artic freezer 7 pro - mikä on prosuun nähden sangen tehokas.

Tietysti noi anturilämpötilat ois hyvä saada vielä oikeiksi. Nyt kone on ollut tovin päällä ja sensors näyttää tältä:

Koodia: [Valitse]
$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage:      +1.15 V  (min =  +0.85 V, max =  +1.60 V)
 +3.3 Voltage:      +3.26 V  (min =  +2.97 V, max =  +3.63 V)
 +5 Voltage:        +5.04 V  (min =  +4.50 V, max =  +5.50 V)
 +12 Voltage:      +12.10 V  (min = +10.20 V, max = +13.80 V)
CPU FAN Speed:      883 RPM  (min =  600 RPM, max = 7200 RPM)
CHASSIS FAN Speed:    0 RPM  (min =  600 RPM, max = 7200 RPM)
CPU Temperature:    +15.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:     +40.0°C  (high = +45.0°C, crit = +95.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +34.0°C  (high = +78.0°C, crit = +100.0°C)
Core 1:       +36.0°C  (high = +78.0°C, crit = +100.0°C)

Kopassa ei tosiaan ole tuuletinta, mutta on toiminut vuosia ilmankin. On ollut nyt kuitenkin varuiksi ilman sivupeltiä, vaikka ei sillä tuntuisi vaikutusta olevan.

edit: Kävin läpi
Koodia: [Valitse]
sudo sensors-detect
Muutoksia ei lienee tapahtunut, ainakin sensors näyttää edelleen samaa, mutta tässä outputtia siitä kuitenkin:

Koodia: [Valitse]
Now follows a summary of the probes I have just done.
Just press ENTER to continue:

Driver `coretemp':
  * Chip `Intel digital thermal sensor' (confidence: 9)

Driver `w83627ehf':
  * ISA bus, address 0x290
    Chip `Winbond W83627DHG Super IO Sensors' (confidence: 9)

To load everything that is needed, add this to /etc/modules:
#----cut here----
# Chip drivers
coretemp
w83627ehf
#----cut here----
« Viimeksi muokattu: 16.08.18 - klo:09.37 kirjoittanut tmv »

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #4 : 16.08.18 - klo:09.33 »
Koodia: [Valitse]
coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +34.0°C  (high = +78.0°C, crit = +100.0°C)
Core 1:       +36.0°C  (high = +78.0°C, crit = +100.0°C)

Okei, no tuossa näkyy coretempin antamat oikeat ytimen lämpötilat, jotka ovat ainakin tuossa tilanteessa hyvällä tasolla. "CPU Temperature"-rivillä näkyvä matala lämpötila tulee emolevyltä, ja kyseinen sensori on viallinen tai bios/ajurit tulkitsevat sitä väärin.

LeHiX

  • Käyttäjä
  • Viestejä: 810
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #5 : 16.08.18 - klo:09.41 »

Onko coretemp-moduuli ladattuna?

Koodia: [Valitse]
lsmod | grep coretemp
Kokeile ladata se ja tarkista sitten lämpötila uudelleen.

Koodia: [Valitse]
sudo modprobe coretemp
Koodia: [Valitse]
sensors

Onko tuo tarpeellinen, kokeilin:
Koodia: [Valitse]
$ lsmod | grep coretemp # ei mitään ilmoituksia?

$ sudo modprobe coretemp
[sudo] salasana henkilölle:
modprobe: ERROR: could not insert 'coretemp': No such device


mutta kuitenkin sensors sanoo:
Koodia: [Valitse]
$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage:      +1.26 V  (min =  +0.85 V, max =  +1.60 V)
 +3.3 Voltage:      +3.30 V  (min =  +2.97 V, max =  +3.63 V)
 +5 Voltage:        +4.92 V  (min =  +4.50 V, max =  +5.50 V)
 +12 Voltage:      +12.28 V  (min = +10.20 V, max = +13.80 V)
CPU FAN Speed:     4218 RPM  (min =  600 RPM, max = 7200 RPM)
CHASSIS FAN Speed:  900 RPM  (min =  600 RPM, max = 7200 RPM)
POWER FAN Speed:    874 RPM  (min =  600 RPM, max = 7200 RPM)
CPU Temperature:    +55.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:     +33.0°C  (high = +45.0°C, crit = +95.0°C)
Taitaa siellä olla esim. "lmsensors" tai joku vastaava asennettuna?
« Viimeksi muokattu: 16.08.18 - klo:09.43 kirjoittanut LeHiX »
| Pros. AMD Phemon(tm) 9950 :) (4cores) | Emo: ASUS M3A78 | Mem 8GT
| x86_64, ubuntu xorg 22.04  | GeForce GTX 750 Ti/PC

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #6 : 16.08.18 - klo:09.49 »
Onko tuo tarpeellinen, kokeilin:
Koodia: [Valitse]
$ lsmod | grep coretemp # ei mitään ilmoituksia?

$ sudo modprobe coretemp
[sudo] salasana henkilölle:
modprobe: ERROR: could not insert 'coretemp': No such device


Sinulla ei ole Intelin prosessoria väliltä Core 2 - Core 3rd generation (Ivy Bridge), joten käytössä on jokin muu ajuri kuin coretemp.

https://www.kernel.org/doc/Documentation/hwmon/coretemp

LeHiX

  • Käyttäjä
  • Viestejä: 810
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #7 : 16.08.18 - klo:09.58 »
Sinulla ei ole Intelin prosessoria väliltä Core 2 - Core 3rd generation (Ivy Bridge), joten käytössä on jokin muu ajuri kuin coretemp.

https://www.kernel.org/doc/Documentation/hwmon/coretemp

No niinpä tietenkin :)
Koodia: [Valitse]
Driver `it87':
  * ISA bus, address 0x290
    Chip `ITE IT8712F Super IO Sensors' (confidence: 9)

To load everything that is needed, add this to /etc/modules:
#----cut here----
# Chip drivers
it87
#----cut here----
| Pros. AMD Phemon(tm) 9950 :) (4cores) | Emo: ASUS M3A78 | Mem 8GT
| x86_64, ubuntu xorg 22.04  | GeForce GTX 750 Ti/PC

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #8 : 16.08.18 - klo:10.23 »
@LeHiX:

Jos käytössäsi on allekirjoituksessa mainittu Phenom, prosessorin lämpötilan saa k10temp -moduulin avulla. Kuten aiemminkin on ollut puhetta, Phenom 995 -mallia ei ole olemassa, eli prosessorisi on todennäköisesti joko Phenom X4 9950 tai Phenom II X4 955. Phenom II:lla k10tempin pitäisi toimia suoraan, kunhan moduulin lataa. Vanhemmalla Phenom 9950:llä lämpötilan lukeminen täytyy pakottaa moduulin parametrilla force=1, koska AMD:n dokumentaatiossa sensori on todettu epäluotettavaksi: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/653770/comments/55

Voit kokeilla k10temp-ajuria näin:

Koodia: [Valitse]
sudo modprobe k10temp force=1
Koodia: [Valitse]
sensors
Pysyvästi sen saa käyttöön näillä komennoilla:

Koodia: [Valitse]
echo "options k10temp force=1" | sudo tee /etc/modprobe.d/k10temp.conf
Koodia: [Valitse]
echo "k10temp" | sudo tee -a /etc/modules

Kinnari

  • Käyttäjä
  • Viestejä: 407
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #9 : 16.08.18 - klo:10.56 »
Itse sain kaatumisen loppumaan puhaltamalla paineilmalla emolevyn ja tuulettimen puhtaaksi pölystä.
https://forum.ubuntu-fi.org/index.php?topic=53133.msg406860#msg406860

LeHiX

  • Käyttäjä
  • Viestejä: 810
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #10 : 16.08.18 - klo:12.48 »
@LeHiX:

Jos käytössäsi on allekirjoituksessa mainittu Phenom, prosessorin lämpötilan saa k10temp -moduulin avulla. Kuten aiemminkin on ollut puhetta, Phenom 995 -mallia ei ole olemassa, eli prosessorisi on todennäköisesti joko Phenom X4 9950 tai Phenom II X4 955. Phenom II:lla k10tempin pitäisi toimia suoraan, kunhan moduulin lataa. Vanhemmalla Phenom 9950:llä lämpötilan lukeminen täytyy pakottaa moduulin parametrilla force=1, koska AMD:n dokumentaatiossa sensori on todettu epäluotettavaksi: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/653770/comments/55

Voit kokeilla k10temp-ajuria näin:

Koodia: [Valitse]
sudo modprobe k10temp force=1
Koodia: [Valitse]
sensors
Pysyvästi sen saa käyttöön näillä komennoilla:

Koodia: [Valitse]
echo "options k10temp force=1" | sudo tee /etc/modprobe.d/k10temp.conf
Koodia: [Valitse]
echo "k10temp" | sudo tee -a /etc/modules

Aivan oikein joko muistin väärin tai kirutus virhe, korjasin allekirjoitukseen, tota se I-Nex /CPU näyttää:
| Pros. AMD Phemon(tm) 9950 :) (4cores) | Emo: ASUS M3A78 | Mem 8GT
| x86_64, ubuntu xorg 22.04  | GeForce GTX 750 Ti/PC

tmv

  • Käyttäjä
  • Viestejä: 81
    • Profiili
Vs: Todennäköisen rautavian paikallistaminen
« Vastaus #11 : 18.08.18 - klo:15.11 »
Joo, muistit eivät olletkaan ok. Olinpas huolimaton.

Tai itseasiassa muistipiirit olivat kunnossa, mutta ilmeisesti jotain kontaktihäiriötä liittimissä. Vika nimittäin poistui kun vaihdoin muistipalikoiden slotteja emolevyllä ja on nyt pari päivää toiminut  kuten pitääkin.

Ehdin jo tossa katella uudempia koneita, mutta eipä vieläkään tarvinnut lähteä rautaostoksille.