WCM Forum

WCM Forum (http://www.wcm.at/forum/index.php)
-   Hardware-Probleme (http://www.wcm.at/forum/forumdisplay.php?f=3)
-   -   Wieder mal: blue screen (http://www.wcm.at/forum/showthread.php?t=245202)

Quintus14 24.01.2013 19:13

Ich muss - aus gegebenem Anlass - meinen Thread wieder hervor holen :(. Frage: was sagt uns dies:

Code:

Microsoft (R) Windows Debugger Version 6.11.0001.404 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.


Loading Dump File [C:\Windows\Minidump\012413-21044-01.dmp]
Mini Kernel Dump File: Only registers and stack trace are available

Symbol search path is: SRV*C:\SymCache*http://msdl.microsoft.com/download/symbols
Executable search path is:
Windows 7 Kernel Version 7601 (Service Pack 1) MP (8 procs) Free x64
Product: WinNt, suite: TerminalServer SingleUserTS
Built by: 7601.17514.amd64fre.win7sp1_rtm.101119-1850
Machine Name:
Kernel base = 0xfffff800`02c5e000 PsLoadedModuleList = 0xfffff800`02ea3e90
Debug session time: Thu Jan 24 18:45:30.852 2013 (GMT+1)
System Uptime: 0 days 0:00:15.866
Loading Kernel Symbols
.................................................
Loading User Symbols
Mini Kernel Dump does not contain unloaded driver list
*******************************************************************************
*                                                                            *
*                        Bugcheck Analysis                                    *
*                                                                            *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 124, {0, fffffa800a8008f8, 0, 0}

Probably caused by : hardware

Followup: MachineOwner
---------

1: kd> !analyze -v
*******************************************************************************
*                                                                            *
*                        Bugcheck Analysis                                    *
*                                                                            *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa800a8008f8, Address of the WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR:  0x124_GenuineIntel

CUSTOMER_CRASH_COUNT:  1

DEFAULT_BUCKET_ID:  VISTA_DRIVER_FAULT

PROCESS_NAME:  System

CURRENT_IRQL:  0

STACK_TEXT: 
fffff880`035626f0 fffff800`02f21d29 : fffffa80`0a8008d0 fffffa80`09dab680 fffff8a0`001c3a70 00000000`00000000 : nt!WheapCreateLiveTriageDump+0x6c
fffff880`03562c10 fffff800`02e01217 : fffffa80`0a8008d0 fffff800`02e7b658 fffffa80`09dab680 00000000`00000000 : nt!WheapCreateTriageDumpFromPreviousSession+0x49
fffff880`03562c40 fffff800`02d68865 : fffff800`02edd3a0 00000000`00000001 fffff8a0`001c39e8 fffffa80`09dab680 : nt!WheapProcessWorkQueueItem+0x57
fffff880`03562c80 fffff800`02ce8a21 : fffff800`03100100 fffff800`02d68840 fffffa80`09dab600 00000000`00000000 : nt!WheapWorkQueueWorkerRoutine+0x25
fffff880`03562cb0 fffff800`02f7bcce : 00000000`00000000 fffffa80`09dab680 00000000`00000080 fffffa80`09d79070 : nt!ExpWorkerThread+0x111
fffff880`03562d40 fffff800`02ccffe6 : fffff880`0336a180 fffffa80`09dab680 fffff880`033750c0 00000000`00000000 : nt!PspSystemThreadStartup+0x5a
fffff880`03562d80 00000000`00000000 : fffff880`03563000 fffff880`0355d000 fffff880`030c2540 00000000`00000000 : nt!KxStartSystemThread+0x16


STACK_COMMAND:  kb

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: hardware

IMAGE_NAME:  hardware

DEBUG_FLR_IMAGE_TIMESTAMP:  0

FAILURE_BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_MAE_PRV

BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_MAE_PRV

Followup: MachineOwner
---------

1: kd> !analyze -v
*******************************************************************************
*                                                                            *
*                        Bugcheck Analysis                                    *
*                                                                            *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa800a8008f8, Address of the WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR:  0x124_GenuineIntel

CUSTOMER_CRASH_COUNT:  1

DEFAULT_BUCKET_ID:  VISTA_DRIVER_FAULT

PROCESS_NAME:  System

CURRENT_IRQL:  0

STACK_TEXT: 
fffff880`035626f0 fffff800`02f21d29 : fffffa80`0a8008d0 fffffa80`09dab680 fffff8a0`001c3a70 00000000`00000000 : nt!WheapCreateLiveTriageDump+0x6c
fffff880`03562c10 fffff800`02e01217 : fffffa80`0a8008d0 fffff800`02e7b658 fffffa80`09dab680 00000000`00000000 : nt!WheapCreateTriageDumpFromPreviousSession+0x49
fffff880`03562c40 fffff800`02d68865 : fffff800`02edd3a0 00000000`00000001 fffff8a0`001c39e8 fffffa80`09dab680 : nt!WheapProcessWorkQueueItem+0x57
fffff880`03562c80 fffff800`02ce8a21 : fffff800`03100100 fffff800`02d68840 fffffa80`09dab600 00000000`00000000 : nt!WheapWorkQueueWorkerRoutine+0x25
fffff880`03562cb0 fffff800`02f7bcce : 00000000`00000000 fffffa80`09dab680 00000000`00000080 fffffa80`09d79070 : nt!ExpWorkerThread+0x111
fffff880`03562d40 fffff800`02ccffe6 : fffff880`0336a180 fffffa80`09dab680 fffff880`033750c0 00000000`00000000 : nt!PspSystemThreadStartup+0x5a
fffff880`03562d80 00000000`00000000 : fffff880`03563000 fffff880`0355d000 fffff880`030c2540 00000000`00000000 : nt!KxStartSystemThread+0x16


STACK_COMMAND:  kb

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: hardware

IMAGE_NAME:  hardware

DEBUG_FLR_IMAGE_TIMESTAMP:  0

FAILURE_BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_MAE_PRV

BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_MAE_PRV

Followup: MachineOwner
---------

Worauf deutet das hin?

Thx für sachdienliche Hinweise.
Quintus14


System: ASUS P6T, i7/950, 12GB Corsair, System auf Crucial M4, mehrere WD-HDDs, Sapphire Radeon 4870 1GB,

Inzersdorfer 25.01.2013 15:16

Liegt meist an einem Spannungsproblem des Prozessors. (Debuggen ist bei 0x124 wenig sinnvoll, der Error Record wird übrigens mittels !errrec und Adresse aus Parameter2 erreicht, außer in den wenigen Fällen, in denen ein Treiberentwickler durch seinen Treiber einen Processorlock hervorruft)

Quintus14 25.01.2013 15:49

Danke, Inzersdorfer. !errrec bringt leider nur 'No export errec found' - vermutlich weil ich die Auslagerungsdatei abgedreht hatte (hab' sie wieder aktiviert fürn nächsten BSOD).

Ich hab' ja inzwischen quer gegoogelt mit den spärlichen Anhaltspunkten, die ich hatte - an einer Stelle fand ich auch etwas von Spannungsproblemen: ASUS soll damals die Stromsparmechanismen am Limit ausgelegt haben und die CPU u.U. beim Stromsparen zu wenig Spannung bekommen - ebendort soll das Deaktivieren von CE1 im BIOS etwas gebracht haben (das hab' ich jetzt auch mal deaktiviert und warte, ob/wann sich wieder ein BSOD ereignet).

Es ist ja schon eigenartig: nach dem Urlaub im August 2012 hat es mit BSODs angefangen (obwohl nichts am PC geändert wurde), nach Tausch aller möglichen Komponenten war das MoBo als Übeltäter eingegrenzt - getauscht Anfang September. Ein halbes Jahr war jetzt Ruhe (OK, ich brauch' den PC nicht oft) - und jetzt fängt's wieder von vorne an. Wenn das mit der Spannung der CPU zusammen hängt, kann ich nur vermuten, dass irgendwelche Bauteile am MoBo - das Ersatzboard ist ja vermutlich auch schon vor 2 Jahren produziert worden - altern und dann irgendeine Spannungsversorgung geringfügig aus dem Ruder läuft. Woanders stand, man solle im BIOS von 'auto' weg gehen und die Spannungen manuell vergeben - das wäre der nächste Schritt. Aber vielleicht habe ich beim nächsten BSOD mehr Infos.

LG

zonediver 25.01.2013 16:20

Nur so als Tipp: Meist sind die Kondensatoren die Übeltäter, da die über die Jahre stark altern und dann einfach nicht mehr das tun, wofür sie auf's Board gelötet wurden. Die kann man aber (fast) alle selbst tauschen - das nötige Werkzeug und Geschick vorrausgesetzt.

Quintus14 25.01.2013 16:30

Thx, zonediver, für die Info. Ob ich mir allerdings die Arbeit antu'...?

Zitat:

Zitat von Quintus14 (Beitrag 2483252)
... ebendort soll das Deaktivieren von CE1 im BIOS etwas gebracht haben ... das hab' ich jetzt auch mal deaktiviert ...

PCProbe-II zeigt mir aber Vcore im idle trotzdem nur mit 0,94V an. Hmmm ... reicht das Verdrehen von C1E als Versuch einmal(?) oder was müsste ich im BIOS verdrehen, damit ich im idle ein wenig mehr hab'?

Thx
Quintus

Inzersdorfer 25.01.2013 20:16

Liste der Anhänge anzeigen (Anzahl: 1)
Wie du schon erkannt hast, im BIOS manuell einstellen.
increase/decrease QPI/VTT first, if not: increase/decrease vcore...have to test to see which one it is

Auch eine Auswertung des Error Record bringt dir nichts
Angehängt hab ich Einen als Beispiel, typisch nichtssagend, es zeigt nur, das im Ersten Kern der CPU ein Fehler im Cache auftrat.
GCACHEL2_ERR_ERR (Proc 0 Bank 5): Generischer Fehler im L2 Cache_Fehler_Generisch (1.Prozessorkern, Speicherbank 6)

Quintus14 25.01.2013 20:34

Danke für die Info. Habe heute ca. 7 Stunden intensiv Videobearbeitung gemacht - kein Problem bis jetzt. Morgen und übermorgen geht's weiter - ich warte auf den nächsten BSOD, dann poste ich den neuen dump (in der Hoffnung, da steht Genaueres drin) und fang' an, an den Spannungen zu schrauben.

Thx

Quintus14 26.01.2013 17:30

So - nach 1,5 Tagen intensivem Videoschnitt ist der nächste BSOD da: er ereignete sich, als der PC grad mal nix zu tun hatte ...:

Code:

Microsoft (R) Windows Debugger Version 6.11.0001.404 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.


Loading Dump File [C:\Windows\Minidump\012613-21060-01.dmp]
Mini Kernel Dump File: Only registers and stack trace are available

Symbol search path is: SRV*C:\SymCache*http://msdl.microsoft.com/download/symbols
Executable search path is:
Windows 7 Kernel Version 7601 (Service Pack 1) MP (8 procs) Free x64
Product: WinNt, suite: TerminalServer SingleUserTS
Built by: 7601.17514.amd64fre.win7sp1_rtm.101119-1850
Machine Name:
Kernel base = 0xfffff800`02c58000 PsLoadedModuleList = 0xfffff800`02e9de90
Debug session time: Sat Jan 26 17:01:15.030 2013 (GMT+1)
System Uptime: 0 days 9:05:09.029
Loading Kernel Symbols
...............................................................
................................................................
................................
Loading User Symbols
Loading unloaded module list
.....
*******************************************************************************
*                                                                            *
*                        Bugcheck Analysis                                    *
*                                                                            *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 9C, {0, fffff88003090c70, 0, 0}

Unable to load image \SystemRoot\system32\DRIVERS\intelppm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for intelppm.sys
*** ERROR: Module load completed but symbols could not be loaded for intelppm.sys
Probably caused by : intelppm.sys ( intelppm+39c2 )

Followup: MachineOwner
---------

5: kd> !analyze -v
*******************************************************************************
*                                                                            *
*                        Bugcheck Analysis                                    *
*                                                                            *
*******************************************************************************

MACHINE_CHECK_EXCEPTION (9c)
A fatal Machine Check Exception has occurred.
KeBugCheckEx parameters;
    x86 Processors
        If the processor has ONLY MCE feature available (For example Intel
        Pentium), the parameters are:
        1 - Low  32 bits of P5_MC_TYPE MSR
        2 - Address of MCA_EXCEPTION structure
        3 - High 32 bits of P5_MC_ADDR MSR
        4 - Low  32 bits of P5_MC_ADDR MSR
        If the processor also has MCA feature available (For example Intel
        Pentium Pro), the parameters are:
        1 - Bank number
        2 - Address of MCA_EXCEPTION structure
        3 - High 32 bits of MCi_STATUS MSR for the MCA bank that had the error
        4 - Low  32 bits of MCi_STATUS MSR for the MCA bank that had the error
    IA64 Processors
        1 - Bugcheck Type
            1 - MCA_ASSERT
            2 - MCA_GET_STATEINFO
                SAL returned an error for SAL_GET_STATEINFO while processing MCA.
            3 - MCA_CLEAR_STATEINFO
                SAL returned an error for SAL_CLEAR_STATEINFO while processing MCA.
            4 - MCA_FATAL
                FW reported a fatal MCA.
            5 - MCA_NONFATAL
                SAL reported a recoverable MCA and we don't support currently
                support recovery or SAL generated an MCA and then couldn't
                produce an error record.
            0xB - INIT_ASSERT
            0xC - INIT_GET_STATEINFO
                  SAL returned an error for SAL_GET_STATEINFO while processing INIT event.
            0xD - INIT_CLEAR_STATEINFO
                  SAL returned an error for SAL_CLEAR_STATEINFO while processing INIT event.
            0xE - INIT_FATAL
                  Not used.
        2 - Address of log
        3 - Size of log
        4 - Error code in the case of x_GET_STATEINFO or x_CLEAR_STATEINFO
    AMD64 Processors
        1 - Bank number
        2 - Address of MCA_EXCEPTION structure
        3 - High 32 bits of MCi_STATUS MSR for the MCA bank that had the error
        4 - Low  32 bits of MCi_STATUS MSR for the MCA bank that had the error
Arguments:
Arg1: 0000000000000000
Arg2: fffff88003090c70
Arg3: 0000000000000000
Arg4: 0000000000000000

Debugging Details:
------------------


BUGCHECK_STR:  0x9C_GenuineIntel

CUSTOMER_CRASH_COUNT:  1

DEFAULT_BUCKET_ID:  VISTA_DRIVER_FAULT

PROCESS_NAME:  System

CURRENT_IRQL:  f

LAST_CONTROL_TRANSFER:  from fffff80002c21818 to fffff80002cd8640

STACK_TEXT: 
fffff880`03090c38 fffff800`02c21818 : 00000000`0000009c 00000000`00000000 fffff880`03090c70 00000000`00000000 : nt!KeBugCheckEx
fffff880`03090c40 fffff800`02c20f57 : 00000000`00000008 00000000`00000000 00000000`00000008 00000000`00000000 : hal!HalpMcaReportError+0x164
fffff880`03090d90 fffff800`02c14e88 : 00000000`00000000 fffff880`03088180 00000000`00000000 00000000`00000000 : hal!HalpMceHandlerWithRendezvous+0x9f
fffff880`03090dc0 fffff800`02cd6f2c : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : hal!HalHandleMcheck+0x40
fffff880`03090df0 fffff800`02cd6d93 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxMcheckAbort+0x6c
fffff880`03090f30 fffff880`03fa09c2 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiMcheckAbort+0x153
fffff880`030b0c98 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : intelppm+0x39c2


STACK_COMMAND:  kb

FOLLOWUP_IP:
intelppm+39c2
fffff880`03fa09c2 ??              ???

SYMBOL_STACK_INDEX:  6

SYMBOL_NAME:  intelppm+39c2

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: intelppm

IMAGE_NAME:  intelppm.sys

DEBUG_FLR_IMAGE_TIMESTAMP:  4a5bc0fd

FAILURE_BUCKET_ID:  X64_0x9C_GenuineIntel_intelppm+39c2

BUCKET_ID:  X64_0x9C_GenuineIntel_intelppm+39c2

Followup: MachineOwner
---------

5: kd> !errec fffff88003090c70
No export errec found

Weist die Geschichte immer noch auf ein Spannungsproblem hin (der STOP-Code ist ja jetzt etwas anders)???

Ich hab' jetzt C1E wieder aktiviert (wie es sich standardmäßig gehört) und die CPU-Voltage im BIOS von 'Auto' (= 0,85 lt CPU) auf 1,000 gestellt: PCProbe-II zeigt nun VCore im idle mit 0,98V statt 0,94V an.

Mal schauen, ob/wann sich der nächste BSOD zeigt.

Thx

Mobiletester 26.01.2013 22:16

Zitat:

Zitat von zonediver (Beitrag 2483253)
Nur so als Tipp: Meist sind die Kondensatoren die Übeltäter, da die über die Jahre stark altern und dann einfach nicht mehr das tun, wofür sie auf's Board gelötet wurden. Die kann man aber (fast) alle selbst tauschen - das nötige Werkzeug und Geschick vorrausgesetzt.

Wobei man das meist schon optisch beurteilen kann. Messen kann man es am Besten mit einem ESR Messgerät in der Schaltung.

Quintus14 26.01.2013 22:45

Ich kann ja morgen mal drauf schauen - aber das P6T soll 5000 hrs all solid capacitors haben. Und dieses Board ist ja erst seit Sept. 2012 in Betrieb (hergestellt vermutlich 2010).


Alle Zeitangaben in WEZ +2. Es ist jetzt 01:55 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 2009 FSL Verlag