Hrvatska akademska i istraživačka mreža
  NASLOVNICA MAPA WEBA TRAŽILICA KONTAKTI CARNET WEB
Hrvatska akademska i istraživačka mreža
 
menu 4
Sigurnost
menu 4
Distribucija
menu 4
Pomoć
menu 4
Dokumenti
menu 4
menu 4

 

 

26-02-05 05:25
Zdravstveni pregled diskova

piše SAŠA DRNJEVIĆ

Tvrdi diskovi su komponenta računala koja se najče?će kvari. U puno slučajeva posljedica kvara je nepovratni gubitak podataka. Zato je bilo koji način sprečavanja gubitka podataka dobrodoš?ao. U tu svrhu proizvođači diskova su prije desetak godina razvili tehnologiju SMART (Self-Monitoring, Analysis and Reporting Technology). Do danas je SMART značajno napredovao, te nam omogućava da na temelju oko 30 internih atributa koji odgovaraju različitim izmjerenim vrijednostima performansi - npr. broj greš?aka pri čitanju, traž?enju i zapisivanju podataka - dobijemo sliku stanja diska. Ako neka izmjerena vrijednost postane manja ili jednaka graničnoj vrijednosti, znači da atribut vi?še nije ispravan. Kod nekih "prefailure" atributa (npr. spin-up time) to mo?že značiti da će disk otkazati u roku od 24 sata.

U ovoj kuharici opisujemo instalaciju i osnovnu uporabu programa za nadzor diskova pomoću SMART sustava pod Debian linuxom. Na ?žalost, ako imate računalo s isključivo hardverskim RAID kontrolerom, ova kuharica vam nije od koristi, jer ne možete pristupati fizičkim diskovima.

Za početak, trebamo instalirati samo jedan paket:

# apt-get install smartmontools

Sama instalacija paketa ne pokreće SMART deamon smartd, pa mož?emo prije pokretanja podesiti konfiguracijske datoteke prema svojim potrebama. Npr. na poslužitelju Končar LEA sa softverskim sustavom RAID1, koji se sastoji od /dev/sda i /dev/sdb fizičkih diskova, mož?emo uključiti nadzor stanja diskova s nekoliko promjena u /etc/smartd.conf:

1) liniju DEVICESCAN treba označiti komentarom, jer ž?elimo eksplicitno nabrojati koji su diskovi za nadzor
2) ispod linije "#/dev/hdc -H -m admin@example.com" upisati:

/dev/sda -d scsi -s H/../../(1|2|3|4|5|6|7)/10 -m vase.ime@domena.hr
/dev/sdb -d scsi -s H/../../(1|2|3|4|5|6|7)/11 -m vase.ime@domena.hr

3) ispod linije "#/dev/sdb -d scsi -s L/../../7/01" upisati:

/dev/sda -d scsi -s L/../../(1|3|5)/02
/dev/sdb -d scsi -s L/../../(2|4|6)/01

U /etc/smartd.conf je opisano ?što gornje linije rade. Mi smo samo promijenili vrijeme izvođenja testova, pa se po novome, pod 3, testovi izvode u ponedjeljak, srijedu, petak u 02:00 sati (za /dev/sda), i u utorak, četvrtak, subotu u 01:00 sati (za /dev/sdb).

Sada u /etc/default/smartmontools mož?emo podesiti da se SMART daemon pokrene pri podizanju poslu?žitelja. Potrebno je samo otkomentirati liniju (kao ?to pi?e):

# uncomment to start smartd on system startup
start_smartd=yes

I jo?š samo pokrenemo SMART daemon:

# /etc/init.d/smartmontools start

Sada imamo podeš?en periodički nadzor diskova preko SMART daemona. No, ako uvid u stanje diska zatreba odmah ili ne ž?elimo koristiti smartd, mož?emo se posluž?iti naredbom "smartctl", koja nam omogućuje pokretanje testova (za vrijeme rada računala), čitanje vrijednosti i zapisanih logova SMART sustava. Slijedi kratak opis nekoliko korisnih opcija (primjer za /dev/sda):

# smartctl -i /dev/sda

Prikazuje model, serijski broj, reviziju firmwarea, da li disk podr?ava SMART i da li je on uključen itd.

# smartctl -s on|off /dev/sda

Uključuje ili isključuje SMART na uređaju.

# smartctl -a /dev/sda

Prikazuje sve dostupne SMART informacije o uređaju (temperaturu, datum proizvodnje, broj pokretanja uređaja, čak i broj pročitanih i zapisanih bajtova itd.)

# smartctl -H /dev/sda

Kratak test, koji prikazuje "SMART health status" uređaja.

# smartctl -t TEST /dev/sda (TEST mo?e biti jedan od: short, long, offline)

Short test obično traje ispod 3 minute, long oko 15 minuta, a offline manje od 1 minute.

# smartctl -l TYPE /dev/sda (TYPE mo?e biti: error ili selftest)

Prikazuje nam zapise u logovima. Short i long testovi zapisuju logove u selftest log, a offline test u error log.

Primjer ispisa error loga:

Error counter log:
Errors Corrected Total Total Correction Gigabytes Total
delay: [rereads/ errors algorithm processed uncorrected
minor | major rewrites] corrected invocations [10^9 bytes] errors
read: 0 10 0 0 0 1578.047 0
write: 0 64064 1 1 0 2695.960 0
verify: 0 0 0 0 0 36.419 0

Non-medium error count: 114

[GLTSD (Global Logging Target Save Disable) set. Enable Save with '-S on']

-----------------------------------------------------------------------------------------

Detaljnije informacije o smartd-u i smartctl-u mo?ete naravno naći u man stranicama, te u /usr/share/doc/smartmontools direktoriju. Home page smartmontools paketa je: http://smartmontools.sourceforge.net

I na kraju mo?žemo instalirati još? jedan vrlo koristan paket koji će nam pomoći kad sumnjamo da je na? disk počeo otkazivati.

# apt-get install scsitools

Scsitools donosi vi?še programa, a mi ćemo se sada osvrnuti samo na korisnu opciju koja nam prikaž?e popis loš?ih sektora na disku, i to "factory defect list", ali i puno zanimljiviju "grown defect list". Dovoljno je otipkati:

# scsiinfo -d /dev/sda

Ako se na na?šem disku počinju pojavljivati loš?i sektori u većem broju, to nam je siguran znak da je disk pri kraju radnog vijeka. Ako se u većim vremenskim razmacima pojave po 1-2 loš?a sektora, to ipak ne mora značiti kraj diska, jer SCSI diskovi vrlo dobro upravljaju (ne)koriš?tenjem neupotrebljivih dijelova.

Primjer ispisa (popis tvorničkih lo?ših sektora je skraćen):

----------------------
Data from Defect Lists
----------------------
418 entries in manufacturer table.
Format is: bytes from index [Cyl:Head:Off]
Offset -1 marks whole track as bad.

1:3:10640 32:4:247716 54:3:0 76:3:114380 ...

2 entries in grown table.
Format is: bytes from index [Cyl:Head:Off]
Offset -1 marks whole track as bad.

14230:4:27311 14240:5:119796





[Lista]
Ovu uslugu CARNeta realizira Sveučilišni računski centar Sveučilišta u Zagrebu
  Copyright ©2005. CARNet. Sva prava zadržana. Impressum.
Mail to
sys-portal@CARNet.hr