Kernel oops
Marco Meier
tolleadresse at gmx.de
Sat Dec 8 06:42:03 CET 2001
Hi Leute,
ich habe ein riesen Problem mit folgendem System:
aktuelles:
debian 2.2rev4
Kernel: 2.3.99pre9
Athlon P800
Adaptec 29160 mit SCSI 36 GB
60 GB HDA
35 GB SDA ( root )
zu Beginn:
debian current unstable
Kernel: 2.4.10
PIII 700, ASUS Mainboard
Adaptec 29160 mit SCSI 36 GB
60 GB HDA ( mit und ohne )
35 GB SDA ( root )
Vor 2 Wochen hat der Server angefangen regelmässig
( durschnittlich 2x täglich bevorzugt Nachts während
der cron Job Verarbeitung ) abzustürtzten.
Und zwar zuerst mit den folgenden drei Zeilen:
CPU 0: Machine Check Exception: 0000000000000004
Nov 20 19:25:01 linux kernel: Bank 4: b200000000040151
Nov 20 19:25:01 linux kernel: Kernel panic: CPU context corrupt
danach war das System vollständig platt. Auch Resettasten
funktionierten nicht mehr.
Zu der Zeit hatten wir debian current unstable.
danach haben wir dann ein Kernel downgrade auf
potato2.2rev4 durchgeführt( mit apt ).
die HDA Festplatte aus dem System entfernt ( und wieder hinzugefügt ).
danach haben wir Speicher, CPU und Mainboard getauscht.
Die Meldung hat sich dann wie folgt verändert:
( Kernel für Athlon neu compiliert ):
auf der Console: Unable to handle kernel NULL pointer dereference at virtual
adress 00000008
Rest der Consolenmeldung im Log ( nur mit absoluten Adressen ):
Dec 8 06:05:47 linux kernel: printing eip:
Dec 8 06:05:47 linux kernel: c013fff0
Dec 8 06:05:47 linux kernel: Oops: 0000
Dec 8 06:05:47 linux kernel: CPU: 0
Dec 8 06:05:47 linux kernel: EIP: 0010:[d_lookup+96/216]
Dec 8 06:05:47 linux kernel: EFLAGS: 00010a83
Dec 8 06:05:47 linux kernel: eax: cffbed98 ebx: 544f4747 ecx: 0000001e
edx: 234fa1eb
Dec 8 06:05:47 linux kernel: esi: c8780320 edi: c8b65660 ebp: 544f475f
esp: c19ebf04
Dec 8 06:05:47 linux kernel: ds: 0018 es: 0018 ss: 0018
Dec 8 06:05:47 linux kernel: Process cp (pid: 1347, stackpage=c19eb000)
Dec 8 06:05:47 linux kernel: Stack: 00000000 c8780320 c8b65660 c19ebf94
cffbed98 cb3da041 234fa1eb 00000009
Dec 8 06:05:47 linux kernel: c0138322 c8780320 c19ebf94 00000000
c0138f0c c8780320 c19ebf94 00000000
Dec 8 06:05:47 linux kernel: c8b656b4 c8780320 00008242 bfffe99c
c0139280 c19ebf94 c8780320 00008241
Dec 8 06:05:47 linux kernel: Call Trace: [cached_lookup+14/80]
[lookup_hash+68/140] [open_namei+316/1244] [filp_open+46/76]
[sys_open+55/200] [system_call+52/56]
Dec 8 06:05:47 linux kernel: Code: 8b 6d 00 8b 54 24 18 39 53 48 75 57 8b
44 24 24 39 43 0c 75
auch nach diesem Absturz ging nichts mehr.
Nach vielen Tests habe ich dann bei dejanews einen Hinweis auf eine
Inkompatibilität
des Adaptec 29160 und des 2.4.10 Kernels gefunden.
So habe ich den Kernel 2.3.99pre9 kompiliert.
Nun läuft das System seit gestern Abend.
Es kommen weiterhin Kernel oopse - jedoch bleibt das System aktiv.
auffällig ist, dass die Oopse vor allem bei Dateizugriffen erfolgen.
Ich versuche die SDA Platte auf der HDA zu sichern. Der Kopierprozess
lief recht lang. Danach ein Oops ( System läuft jedoch auch jetzt
immer noch ). Erneuter start des cp und der oops kam schneller. Und
die Dauer bis zum Oops schien sich von mal zu mal zu verkürzen.
Jeder Tip zur Lösung ist Willkommen ;-)
Marco.
More information about the Linux
mailing list