Ubuntu Suomen keskustelualueet
Ubuntun käyttö => Laitealue => Aiheen aloitti: tmv - 15.08.18 - klo:13.50
-
Oireet ovat: kone kaatuu, eikä reagoi näppäimistön painalluksiin, vain reset tai virtanappi sammuttaa.
Miten voisin paikallistaa mistä vika johtuu? En /var/log tiedostoista löytänyt mitään ihmeelistä. Pitäisikö siellä olla?
- Muistit OK
- Näytönohjain OK (Otin pois ja menee emolevyn näyttiksellä)
Epäilen emolevyn kuumentumista, sillä ulkoisesti kokeilemalla siinä oleva jäähdytyselementti on huomattavan kuuma. Manuaalin mukaan elementin alla on Intel MCH G33 piiri. sensors näyttää lämmöt kuitenkin ok. Toisaalta epäilen sensorsin fuulaavaan lämpötiloja; prossun lämpötila tuskin on 19 astetta, se olisi jo huoneilmaa matalampi.
Asensin phoronix-test-suite ohjelman, mutta myönnän sen olevan liian kryptinen osaakseni sitä käyttää. Osaisko joku sanoa jotain pätevää testiä?
Emolevy: Asus P5K-VM
Prossu: Intel core2duo 2,66Ghz - ei kellotettu
$ sensors
CPU Temperature: +19.0°C (high = +60.0°C, crit = +95.0°C)
MB Temperature: +42.0°C (high = +45.0°C, crit = +95.0°C)
-
Oletko tutkinut fyysisesti onko CPUn tuuletin/jäähdytin kunnolla kiinni, itselläni Helmikuussa (2018) kone sanoi itsensä irti juuri kun olin päättänyt istua sen äärellä pitempään kun kaaduin pahasti pihalla :( No olin puhelimen varassa 5kk ja kun kyllästyin käytin konetta huollossa.
Vika oli että koneen CPUn jäähdyttimen pidikkeestä oli "ala" sakara (emolevy pystyssä koneessa) lohjennut ja jäähdytin vain roikkuin yläsakaran varassa ja jäähdyttimen "pasta" oli kuivunut ja lohkeillut, ei sekään kestä näköjään kymmentä (10) vuotta ???, en tiedä kuinka kauan se on ollut rikki mutta muutin nykyiseen asuntoon toukokuussa 2017 :(
Lämmöt oli välillä 80C asti ja kone huusi kuin sumusireeni.
Sitä Jäähdyttimen pidikettä asentaessa niintä meni siis pari tärviölle kun uusikin lohkesi samasta kohtaa, hankin uuden (sain takuuseen vaikka oli käytetty, jostain koneesta irroitettu) luovutin ja vein huoltoon.
Nyt on paljon hiljaisempi ja viileämpi vaikka voisi olla hiljaisempi ja viileämpi :)
LeHiX@LeHiX:~$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage: +1.04 V (min = +0.85 V, max = +1.60 V)
+3.3 Voltage: +3.30 V (min = +2.97 V, max = +3.63 V)
+5 Voltage: +4.92 V (min = +4.50 V, max = +5.50 V)
+12 Voltage: +12.28 V (min = +10.20 V, max = +13.80 V)
CPU FAN Speed: 2960 RPM (min = 600 RPM, max = 7200 RPM)
CHASSIS FAN Speed: 906 RPM (min = 600 RPM, max = 7200 RPM)
POWER FAN Speed: 877 RPM (min = 600 RPM, max = 7200 RPM)
CPU Temperature: +47.0°C (high = +60.0°C, crit = +95.0°C)
MB Temperature: +33.0°C (high = +45.0°C, crit = +95.0°C)
-
Emolevy: Asus P5K-VM
Prossu: Intel core2duo 2,66Ghz - ei kellotettu
$ sensors
CPU Temperature: +19.0°C (high = +60.0°C, crit = +95.0°C)
MB Temperature: +42.0°C (high = +45.0°C, crit = +95.0°C)
19 astetta on tosiaan virheellinen lukema. Käytännössä prosessorin lämpötila on ilmajäähdytyksellä 40 asteen yläpuolella, ja kuormitettuna voi nousta 70 asteeseen.
Onko coretemp-moduuli ladattuna?
lsmod | grep coretemp
Kokeile ladata se ja tarkista sitten lämpötila uudelleen.
sudo modprobe coretemp
sensors
Kannattaa tosiaan tarkistaa prosessorin jäähdyttimen kiinnitys, puhtaus pölystä ja tuulettimen pyöriminen, eli että se oikeasti siirtää ilmaa.
Lisäksi tuon ikäisessä koneessa voi olla tarpeen vaihtaa jäähdyttimen ja prosessorin välissä oleva lämpötahna.
-
Onko coretemp-moduuli ladattuna?
Näyttäisi olevan.
$ lsmod | grep coretemp
coretemp 16384 0
Kannattaa tosiaan tarkistaa prosessorin jäähdyttimen kiinnitys, puhtaus pölystä ja tuulettimen pyöriminen, eli että se oikeasti siirtää ilmaa.
Lisäksi tuon ikäisessä koneessa voi olla tarpeen vaihtaa jäähdyttimen ja prosessorin välissä oleva lämpötahna.
Voi olla, että pitää tarkistaa jäähdyttimien kiinnitykset ja piitahna, vaikka se on ollut "vasta" 5-vuotta siinä kiinni.
Laitoin siihen silloin kiinni uuden tuulettimen prossuun - artic freezer 7 pro - mikä on prosuun nähden sangen tehokas.
Tietysti noi anturilämpötilat ois hyvä saada vielä oikeiksi. Nyt kone on ollut tovin päällä ja sensors näyttää tältä:
$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage: +1.15 V (min = +0.85 V, max = +1.60 V)
+3.3 Voltage: +3.26 V (min = +2.97 V, max = +3.63 V)
+5 Voltage: +5.04 V (min = +4.50 V, max = +5.50 V)
+12 Voltage: +12.10 V (min = +10.20 V, max = +13.80 V)
CPU FAN Speed: 883 RPM (min = 600 RPM, max = 7200 RPM)
CHASSIS FAN Speed: 0 RPM (min = 600 RPM, max = 7200 RPM)
CPU Temperature: +15.0°C (high = +60.0°C, crit = +95.0°C)
MB Temperature: +40.0°C (high = +45.0°C, crit = +95.0°C)
coretemp-isa-0000
Adapter: ISA adapter
Core 0: +34.0°C (high = +78.0°C, crit = +100.0°C)
Core 1: +36.0°C (high = +78.0°C, crit = +100.0°C)
Kopassa ei tosiaan ole tuuletinta, mutta on toiminut vuosia ilmankin. On ollut nyt kuitenkin varuiksi ilman sivupeltiä, vaikka ei sillä tuntuisi vaikutusta olevan.
edit: Kävin läpi sudo sensors-detect
Muutoksia ei lienee tapahtunut, ainakin sensors näyttää edelleen samaa, mutta tässä outputtia siitä kuitenkin:
Now follows a summary of the probes I have just done.
Just press ENTER to continue:
Driver `coretemp':
* Chip `Intel digital thermal sensor' (confidence: 9)
Driver `w83627ehf':
* ISA bus, address 0x290
Chip `Winbond W83627DHG Super IO Sensors' (confidence: 9)
To load everything that is needed, add this to /etc/modules:
#----cut here----
# Chip drivers
coretemp
w83627ehf
#----cut here----
-
coretemp-isa-0000
Adapter: ISA adapter
Core 0: +34.0°C (high = +78.0°C, crit = +100.0°C)
Core 1: +36.0°C (high = +78.0°C, crit = +100.0°C)
Okei, no tuossa näkyy coretempin antamat oikeat ytimen lämpötilat, jotka ovat ainakin tuossa tilanteessa hyvällä tasolla. "CPU Temperature"-rivillä näkyvä matala lämpötila tulee emolevyltä, ja kyseinen sensori on viallinen tai bios/ajurit tulkitsevat sitä väärin.
-
Onko coretemp-moduuli ladattuna?
lsmod | grep coretemp
Kokeile ladata se ja tarkista sitten lämpötila uudelleen.
sudo modprobe coretemp
sensors
Onko tuo tarpeellinen, kokeilin:
$ lsmod | grep coretemp # ei mitään ilmoituksia?
$ sudo modprobe coretemp
[sudo] salasana henkilölle:
modprobe: ERROR: could not insert 'coretemp': No such device
mutta kuitenkin sensors sanoo:
$ sensors
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage: +1.26 V (min = +0.85 V, max = +1.60 V)
+3.3 Voltage: +3.30 V (min = +2.97 V, max = +3.63 V)
+5 Voltage: +4.92 V (min = +4.50 V, max = +5.50 V)
+12 Voltage: +12.28 V (min = +10.20 V, max = +13.80 V)
CPU FAN Speed: 4218 RPM (min = 600 RPM, max = 7200 RPM)
CHASSIS FAN Speed: 900 RPM (min = 600 RPM, max = 7200 RPM)
POWER FAN Speed: 874 RPM (min = 600 RPM, max = 7200 RPM)
CPU Temperature: +55.0°C (high = +60.0°C, crit = +95.0°C)
MB Temperature: +33.0°C (high = +45.0°C, crit = +95.0°C)
Taitaa siellä olla esim. "lmsensors" tai joku vastaava asennettuna?
-
Onko tuo tarpeellinen, kokeilin:
$ lsmod | grep coretemp # ei mitään ilmoituksia?
$ sudo modprobe coretemp
[sudo] salasana henkilölle:
modprobe: ERROR: could not insert 'coretemp': No such device
Sinulla ei ole Intelin prosessoria väliltä Core 2 - Core 3rd generation (Ivy Bridge), joten käytössä on jokin muu ajuri kuin coretemp.
https://www.kernel.org/doc/Documentation/hwmon/coretemp
-
Sinulla ei ole Intelin prosessoria väliltä Core 2 - Core 3rd generation (Ivy Bridge), joten käytössä on jokin muu ajuri kuin coretemp.
https://www.kernel.org/doc/Documentation/hwmon/coretemp
No niinpä tietenkin :)
Driver `it87':
* ISA bus, address 0x290
Chip `ITE IT8712F Super IO Sensors' (confidence: 9)
To load everything that is needed, add this to /etc/modules:
#----cut here----
# Chip drivers
it87
#----cut here----
-
@LeHiX:
Jos käytössäsi on allekirjoituksessa mainittu Phenom, prosessorin lämpötilan saa k10temp -moduulin avulla. Kuten aiemminkin on ollut puhetta, Phenom 995 -mallia ei ole olemassa, eli prosessorisi on todennäköisesti joko Phenom X4 9950 tai Phenom II X4 955. Phenom II:lla k10tempin pitäisi toimia suoraan, kunhan moduulin lataa. Vanhemmalla Phenom 9950:llä lämpötilan lukeminen täytyy pakottaa moduulin parametrilla force=1, koska AMD:n dokumentaatiossa sensori on todettu epäluotettavaksi: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/653770/comments/55
Voit kokeilla k10temp-ajuria näin:
sudo modprobe k10temp force=1
sensors
Pysyvästi sen saa käyttöön näillä komennoilla:
echo "options k10temp force=1" | sudo tee /etc/modprobe.d/k10temp.conf
echo "k10temp" | sudo tee -a /etc/modules
-
Itse sain kaatumisen loppumaan puhaltamalla paineilmalla emolevyn ja tuulettimen puhtaaksi pölystä.
https://forum.ubuntu-fi.org/index.php?topic=53133.msg406860#msg406860 (https://forum.ubuntu-fi.org/index.php?topic=53133.msg406860#msg406860)
-
@LeHiX:
Jos käytössäsi on allekirjoituksessa mainittu Phenom, prosessorin lämpötilan saa k10temp -moduulin avulla. Kuten aiemminkin on ollut puhetta, Phenom 995 -mallia ei ole olemassa, eli prosessorisi on todennäköisesti joko Phenom X4 9950 tai Phenom II X4 955. Phenom II:lla k10tempin pitäisi toimia suoraan, kunhan moduulin lataa. Vanhemmalla Phenom 9950:llä lämpötilan lukeminen täytyy pakottaa moduulin parametrilla force=1, koska AMD:n dokumentaatiossa sensori on todettu epäluotettavaksi: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/653770/comments/55
Voit kokeilla k10temp-ajuria näin:
sudo modprobe k10temp force=1
sensors
Pysyvästi sen saa käyttöön näillä komennoilla:
echo "options k10temp force=1" | sudo tee /etc/modprobe.d/k10temp.conf
echo "k10temp" | sudo tee -a /etc/modules
Aivan oikein joko muistin väärin tai kirutus virhe, korjasin allekirjoitukseen, tota se I-Nex /CPU näyttää:
-
Joo, muistit eivät olletkaan ok. Olinpas huolimaton.
Tai itseasiassa muistipiirit olivat kunnossa, mutta ilmeisesti jotain kontaktihäiriötä liittimissä. Vika nimittäin poistui kun vaihdoin muistipalikoiden slotteja emolevyllä ja on nyt pari päivää toiminut kuten pitääkin.
Ehdin jo tossa katella uudempia koneita, mutta eipä vieläkään tarvinnut lähteä rautaostoksille.