Raidhotremove ?

Florian Lohoff flo at rfc822.org
Thu Aug 26 20:40:33 CEST 1999


On Thu, Aug 26, 1999 at 08:24:37PM +0200, Dietmar Goldbeck wrote:
> On Thu, Aug 26, 1999 at 11:13:34AM +0200, Florian Lohoff wrote:
> > On Wed, Aug 25, 1999 at 09:34:48PM +0200, Dietmar Goldbeck wrote:
> > > On Wed, Aug 25, 1999 at 05:54:51PM +0200, Florian Lohoff wrote:
> > > > Hi,
> > > > wie kann ich aus einem raid5 eine platte ausser betrieb nehmen ?
> > > > 
> > > > (root at puke)~# raidhotremove -a /dev/md0 /dev/sdh1
> > > > /dev/md0: can not hot-remove disk: disk busy!
> > > > 
> > > > So scheints nicht so gehen ...
> > > > 
> > > 
> > > Das geht auch nur wenn die Platte im Ar... ist. Dann sollte es mit 
> > > raidhotremove /dev/md0 /dev/sdh1 gehen (ohne -a).
> > > 
> > > Wenn Du das ganze nur testen willst, brauchst Du eine ganz neue Version mit 
> > > der man Festplatten als "failed" setzen kann. 
> > 
> > /me compiled gerade 0.90-990824
> > 
> > Mal schaun - Im moment bin ich aber von dem raid kram noch nicht so ueberzeugt.
> > Habe versucht mal bei aktivitaet auf dem raid ne platte rauszuziehen - 
> > Die kiste ist mehr oder minder gecrasht (Zumindest war sie total unbrauchbar
> > durch die massiven SCSI fehler.) Eigentlich habe ich gehofft das
> > der raidcode nach den ersten 2 SCSI Fehlern die platte nicht mehr
> > benutzt - Mag aber auch an dem SUN Scsi controller gelegen haben - Ich
> > werde mir mal nen Wide Controller fuer "normal-pci" kaufen und noch
> > mal mit dem probieren ...
> > 
> 
> Dann wird ja nicht die Platte fehlerhaft, sondern der SCSI Bus, weil
> ploetzlich ein Geraet den Bus stoert. Wenn die Platte korrekt SCSI macht
> und einfach Lesefehler meldet, gibt es keine Probleme. 
> Ich hatte das schon mehrmals mit ganz neuen Platten, die wohl noch
> einzelne defekte Blöcke hatten, die noch nicht in der platteninternen
> Tabelle waren. Ich habe dann einfach ein raidhotremove, badblocks
> raidhotadd gemacht und alles war gut. Ganz ohne boot oder irgendetwas.
> 
> Wenn nicht die Mechanik, sondern der SCSI Anschluss und/oder die
> Firmware spinnen, musst Du sowieso den Rechner runterfahren. Der
> Unterschied bei RAID ist nur, das die Daten noch im Rechner sind, wenn
> die Platte schon im Muell ist. (Teure) Abhilfe: Jeder Platte ihren eigenen 
> Controller geben.

Soweit alles richtig - Aber eigentlich haette ich erwartet das die platte
nachdem sie SCSI technisch nicht mehr ansprechbar ist auch aus dem raid
setup genommen wird - Weit gefehlt - Der probiert immer weiter auf
die platte zu schreiben und erkennt den fehler nichtmal ...

Flo
-- 
Florian Lohoff		flo at rfc822.org		      	+49-5241-470566
  ...  The failure can be random; however, when it does occur, it is
  catastrophic and is repeatable  ...             Cisco Field Notice



More information about the Linux mailing list