Ubuntu Suomen keskustelualueet
Ubuntun käyttö => Laitealue => Aiheen aloitti: jarmala - 10.01.20 - klo:15.54
-
Nyt on pari kertaa käynyt niin, että pöytökoneessa kiinni oleva levy /dev/sdc1 on kesken kaiken kadonnut. Ensiksi levy on mountattu ihan ok ja se toimii, mutta sitten yhtäkkiä se on lakannut olemasta läsnä. Levylle kyllä silloinkin pääsee, mutta siellä näkyy vain . ja .. -hakemistot.
Kun pc:n sammuttaa ja buuttaa uudelleen, levy tulee näkyviin:
$ df
Tiedostojärjestelmä 1K-lohkot Käyt Vapaana Käy% Liitospiste
udev 3996420 0 3996420 0% /dev
tmpfs 805560 3824 801736 1% /run
/dev/sda1 28704676 24224148 2999364 89% /
tmpfs 4027792 28400 3999392 1% /dev/shm
tmpfs 5120 4 5116 1% /run/lock
tmpfs 4027792 0 4027792 0% /sys/fs/cgroup
/dev/loop0 4352 4352 0 100% /snap/gnome-calculator/536
/dev/loop3 15104 15104 0 100% /snap/gnome-characters/367
/dev/loop1 1024 1024 0 100% /snap/gnome-logs/73
/dev/loop2 1024 1024 0 100% /snap/gnome-logs/81
/dev/loop4 3840 3840 0 100% /snap/gnome-system-monitor/111
/dev/loop5 45312 45312 0 100% /snap/gtk-common-themes/1353
/dev/loop6 3840 3840 0 100% /snap/gnome-system-monitor/123
/dev/loop8 43904 43904 0 100% /snap/gtk-common-themes/1313
/dev/loop9 88064 88064 0 100% /snap/shotcut/59
/dev/loop7 144128 144128 0 100% /snap/gnome-3-26-1604/97
/dev/loop10 144128 144128 0 100% /snap/gnome-3-26-1604/98
/dev/loop11 15104 15104 0 100% /snap/gnome-characters/375
/dev/loop12 160512 160512 0 100% /snap/gnome-3-28-1804/110
/dev/loop14 4352 4352 0 100% /snap/gnome-calculator/544
/dev/loop13 88064 88064 0 100% /snap/shotcut/58
/dev/loop15 91264 91264 0 100% /snap/core/8213
/dev/loop16 92672 92672 0 100% /snap/igotu2gpx/x1
/dev/loop17 55936 55936 0 100% /snap/core18/1288
/dev/loop18 55936 55936 0 100% /snap/core18/1279
/dev/loop19 159872 159872 0 100% /snap/gnome-3-28-1804/91
/dev/loop20 91264 91264 0 100% /snap/core/8268
/dev/sda5 86018152 48254836 33350800 60% /home
/dev/sdb1 480589544 298078616 158075268 66% /a
/dev/sdd1 480589544 444950128 11203756 98% /b
/dev/sdc1 2884153072 1899773956 837849452 70% /mnt/0b7685fd-103e-4b62-9c70-8c8adf53f82d
tmpfs 805556 16 805540 1% /run/user/121
tmpfs 805556 104 805452 1% /run/user/1000
Hmm? Koska tuo sdc1 on nimenomaan suuri työlevyni, niin alkaa huolestuttaa... Otan näet sieltä muutaman hakemistopuun käyttöön bindilla seuraavalla skriptillä:
$ cat mountit
#!/bin/sh
if [ "$(whoami)" != "root" ]
then
echo Kutsutaan sudolla itseään...
sudo $0
[ $SHLVL -eq 1 ] && { printf "sulje> " ; read any; }
return
fi
sudo mount --bind /mnt/0b7685fd-103e-4b62-9c70-8c8adf53f82d/ari/avi/ avi
sudo mount --bind /mnt/0b7685fd-103e-4b62-9c70-8c8adf53f82d/ari/data/ data
sudo mount --bind /mnt/0b7685fd-103e-4b62-9c70-8c8adf53f82d/ari/kuvat/ kuvat
sudo mount --bind /mnt/0b7685fd-103e-4b62-9c70-8c8adf53f82d/ari/musa/ musa
echo Mountit tehty. Kaikki lienee ok.
Onko kennelläkään ollut mitään vastaavaa hankaluutta?
-
Nyt on pari kertaa käynyt niin, että pöytökoneessa kiinni oleva levy /dev/sdc1 on kesken kaiken kadonnut. Ensiksi levy on mountattu ihan ok ja se toimii, mutta sitten yhtäkkiä se on lakannut olemasta läsnä.
Mitä kernelin loki kertoo, kun levy on irronnut?
dmesg
Kannattaa myös tarkistaa levyn fyysiset kytkennät, eli sammuta kone, avaa se, irrota levyn virtakaapeli sekä SATA-kaapeli (molemmista päistä) ja kytke ne huolellisesti takaisin.
Levylle kyllä silloinkin pääsee, mutta siellä näkyy vain . ja .. -hakemistot.
Liitoksen irrottua näet vain liitoshakemiston, joka on olemassa juuriosiolla.
-
Mitä kernelin loki kertoo, kun levy on irronnut?
dmesg
Enpä tuota hoksannut tehdä silloin heti ja nyt buuttauksen jälkeen se sanoo vain
$ dmesg | grep sdc1
[ 1.649208] sdc: sdc1
[ 41.934302] EXT4-fs (sdc1): recovery complete
[ 42.002828] EXT4-fs (sdc1): mounted filesystem with ordered data mode. Opts: (null)
-
Enpä tuota hoksannut tehdä silloin heti ja nyt buuttauksen jälkeen se sanoo vain
Myös vanhempia lokeja voi kaivella journalctl:llä:
journalctl --list-boots
journalctl -b -1 -t kernel
(Huomaa, että journalctl näyttää lokin alusta lähtien ja sitä voi selata nuoli- ja Page Up/Down-näppäimillä. Haku vaikkapa hakusanalla sdc onnistuu kirjoittamalla /sdc ja painamalla enteriä.)
-
No nyt se tapahtui uudestaan jo runsaan tunnin kuluttua buuttauksesta:
$ dmesg | grep sdc1
[ 1.649208] sdc: sdc1
[ 41.934302] EXT4-fs (sdc1): recovery complete
[ 42.002828] EXT4-fs (sdc1): mounted filesystem with ordered data mode. Opts: (null)
[ 5953.275944] EXT4-fs warning (device sdc1): dx_probe:758: inode #61866000: lblock 0: comm ls: error -5 reading directory block
Eli noudatin nm:n ohjeita: molemmat piuhat levystä irti ja takaisin paikoilleen, sekä myös datakaapelin toinen pää emosta irti ja takaisin.
Jännityksellä odotellaan, miten jaksaa toimia näiden jälkeen...
-
journalctl -b -1 -t kernel
Tuolta loytyy asiaan liittyen:
tammi 10 16:53:15 ari kernel: ata2.00: exception Emask 0x50 SAct 0x0 SErr 0x40d0802 action 0xe
tammi 10 16:53:15 ari kernel: ata2.00: SError: { RecovComm HostInt PHYRdyChg CommWake 10B8B DevExch }
tammi 10 16:53:15 ari kernel: ata2.00: failed command: CHECK POWER MODE
tammi 10 16:53:15 ari kernel: ata2.00: cmd e5/00:00:00:00:00/00:00:00:00:00/00 tag 0
res 51/04:00:00:00:00/00:00:00:00:00/00 Emask 0x50 (ATA bus error)
tammi 10 16:53:15 ari kernel: ata2.00: status: { DRDY ERR }
tammi 10 16:53:15 ari kernel: ata2.00: error: { ABRT }
tammi 10 16:53:15 ari kernel: ata2.00: hard resetting link
tammi 10 16:53:16 ari kernel: ata2.01: hard resetting link
tammi 10 16:53:16 ari kernel: ata2.00: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
tammi 10 16:53:16 ari kernel: ata2.01: SATA link up 3.0 Gbps (SStatus 123 SControl 330)
tammi 10 16:53:16 ari kernel: ata2.00: both IDENTIFYs aborted, assuming NODEV
tammi 10 16:53:16 ari kernel: ata2.00: revalidation failed (errno=-2)
tammi 10 16:53:21 ari kernel: ata2.00: hard resetting link
tammi 10 16:53:22 ari kernel: ata2.01: hard resetting link
tammi 10 16:53:22 ari kernel: ata2.00: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
tammi 10 16:53:22 ari kernel: ata2.01: SATA link up 3.0 Gbps (SStatus 123 SControl 330)
tammi 10 16:53:22 ari kernel: ata2.00: both IDENTIFYs aborted, assuming NODEV
tammi 10 16:53:22 ari kernel: ata2.00: revalidation failed (errno=-2)
tammi 10 16:53:27 ari kernel: ata2.00: hard resetting link
tammi 10 16:53:27 ari kernel: ata2.01: hard resetting link
tammi 10 16:53:28 ari kernel: ata2.00: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
tammi 10 16:53:28 ari kernel: ata2.01: SATA link up 3.0 Gbps (SStatus 123 SControl 330)
tammi 10 16:53:28 ari kernel: ata2.00: both IDENTIFYs aborted, assuming NODEV
tammi 10 16:53:28 ari kernel: ata2.00: revalidation failed (errno=-2)
tammi 10 16:53:28 ari kernel: ata2.00: disabled
tammi 10 16:53:33 ari kernel: ata2.00: hard resetting link
tammi 10 16:53:33 ari kernel: ata2.01: hard resetting link
tammi 10 16:53:34 ari kernel: ata2.00: SATA link up 6.0 Gbps (SStatus 133 SControl 330)
tammi 10 16:53:34 ari kernel: ata2.01: SATA link up 3.0 Gbps (SStatus 123 SControl 330)
tammi 10 16:53:34 ari kernel: ata2.00: both IDENTIFYs aborted, assuming NODEV
tammi 10 16:53:34 ari kernel: ata2.01: configured for UDMA/133
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: rejecting I/O to offline device
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: killing request
tammi 10 16:53:34 ari kernel: ata2: EH complete
tammi 10 16:53:34 ari kernel: ata2.00: detaching (SCSI 1:0:0:0)
tammi 10 16:53:34 ari kernel: print_req_error: I/O error, dev sdc, sector 0
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: [sdc] Synchronizing SCSI cache
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: [sdc] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: [sdc] Stopping disk
tammi 10 16:53:34 ari kernel: sd 1:0:0:0: [sdc] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
tammi 10 17:21:45 ari kernel: blk_partition_remap: fail for partition 1
tammi 10 17:21:45 ari kernel: EXT4-fs warning (device sdc1): dx_probe:758: inode #61866000: lblock 0: comm ls: error -5 reading direc
tammi 10 17:22:54 ari kernel: rfkill: input handler enabled
tammi 10 17:22:56 ari kernel: systemd-shutdow: 34 output lines suppressed due to ratelimiting
Eh?
-
Eli noudatin nm:n ohjeita: molemmat piuhat levystä irti ja takaisin paikoilleen, sekä myös datakaapelin toinen pää emosta irti ja takaisin.
Jännityksellä odotellaan, miten jaksaa toimia näiden jälkeen...
Piuhojen kiskomisen jälkeen levy näyttää nyt toimineen ok jo kolme päivää. Kontaktihäiriö poistui siis.
-
Kun ongelma poistui niin nyt on hyvä aikaa käydä ostamassa toinen kovalevy rinnalle ja luoda sille raid1. Mielestäni raid1:sen voi perustaa myös yhdelle levylle.
Ja tarkistaa kovalevyn smart tiedot.
-
Kun ongelma poistui niin nyt on hyvä aikaa käydä ostamassa toinen kovalevy rinnalle ja luoda sille raid1. Mielestäni raid1:sen voi perustaa myös yhdelle levylle.
Ja tarkistaa kovalevyn smart tiedot.
raid1 tarkoittaa sitä että pitää olla kaksi fyysistä levyä, joiden sisältö on identtinen. Eli sitä EI voi perustaa yhdelle levylle.
-
Tämä piti oikein tarkistaa kun kirjoitin vain mutu tuntumalla ...
Tämä menisi yhden ohjeen mukaisesti jotenkin näin :
mdadm --create --verbose /dev/md0 --level=mirror --raid-devices=2 /dev/sdXX1 missing
mkfs -textXSE /dev/md0
Tämä ohje ei suoraan toimi koska pari vipua on muutettu siten ettei voi käyttää suoraan mutta tämä olisi se tapa miten tätä käytettäisiin (kirjoitin tahallaan pari vipua väärin jottei synny halua kopioida suoraan käyttikseen).
ja
ja sitten levyn lisääminen pakkaan :
mdadm /dev/md0 --add /dev/sXa1
Itse en ole testanut tätä (vielä ...).
-
Tämä piti oikein tarkistaa kun kirjoitin vain mutu tuntumalla ...
Tämä menisi yhden ohjeen mukaisesti jotenkin näin :
mdadm --create --verbose /dev/md0 --level=mirror --raid-devices=2 /dev/sdXX1 missing
mkfs -textXSE /dev/md0
Tämä ohje ei suoraan toimi koska pari vipua on muutettu siten ettei voi käyttää suoraan mutta tämä olisi se tapa miten tätä käytettäisiin (kirjoitin tahallaan pari vipua väärin jottei synny halua kopioida suoraan käyttikseen).
ja
ja sitten levyn lisääminen pakkaan :
mdadm /dev/md0 --add /dev/sXa1
Itse en ole testanut tätä (vielä ...).
Mitä järkeä on "mutu" tuntumalla pistää "ohjeita" jotka ei edes toimi tai pidä paikkaansa?
-
RAID-keskustelun voisi varmaan jakaa uudeksi aiheeksi.
Mitä järkeä on "mutu" tuntumalla pistää "ohjeita" jotka ei edes toimi tai pidä paikkaansa?
Linkki lähteeseen voisi tässä tosiaan olla paikallaan, vaikka periaate sinänsä selviää myös Matsukanin viestistä. Tässä Archin wikin ohje, kuinka yhden levyn RAID 1 -pakka otetaan käyttöön (jotta ei tarvita kahta uutta levyä nykyisen rinnalle, kun olemassa oleva asennus siirretään RAID-levyjärjestelmään):
https://wiki.archlinux.org/index.php/Convert_a_single_drive_system_to_RAID
-
Hyvä kysymys. Ajattelin sen testata illan hämärissä mutta teinkin sen sitten äskettäin.
sudo mdadm --create /dev/md0 --level=mirror --raid-devices=2 missing /dev/sdb1
ja sitten
sudo mkfs.ext4 /dev/md0
Toimii. Jo koska kirjoittajalla oli kyseessä työlevy niin oletin että boot asioista ei tarvitse huolehtia.