Aurora R4 GeForce GTX 690 - PC friert ein

Desktops - Allgemeine Hardware

Desktops - Allgemeine  Hardware
Diskutieren Sie mit uns über allgemeine Desktop Themen und Workstations

Aurora R4 GeForce GTX 690 - PC friert ein

This question has been answered by DELL-Tom G

Hallo liebe Community,


ich habe das Problem, dass seit einiger Zeit mein Aurora R4 vor allem bei Spielen einfriert. Dies ist nicht reproduzierbar, sondern tritt ab und an mal auf. Mal häufiger und mal längere Zeit nicht.

Es äußert sich so, dass mitten im Spiel oder einer anderen intensiveren Anwendung mein Bildschirm sagt er habe kein Videosignal mehr, der Sound hängt wie ein Maschinengewehr und dann startet nach kurzer Zeit der Rechner neu. Es wirkt fast so wie ein Bluescreen allerdings ohne dass ich ihn sehen könnte, da der Monitor kein Signal mehr erhält.

Meine Vermutung ist irgendwie, dass die Grafikkarte zu heiß läuft, wobei Benchmarks und auch Tests über die Dell Diagnose im Support Bereich keine Probleme aufzeigten. Hierbei ging die Temperatur der GPU bis etwa 82°C hoch.

Treiber sind direkt von NVidia und immer aktuell gehalten.
Auch habe ich mir gerade heute den Rechner von innen angeschaut, vor allem die Lüfter etc. auf Verschmutzung geprüft. Auch bei offenen Gehäuse den Rechner gestartet und geschaut ob wirklich alle Lüfter funktionieren. Ergebnis war, dass alle augenscheinlich normal laufen und keine bedenkliche Verschmutzung vorhanden ist.

Vor einiger Zeit (etwa 1,5 Monaten) hatte ich einmal einen Bluescreen, der sich auf die nvlddmkm.sys bezog, die meines Wissens nach zu den Grafikkartentreibern gehört. Aber auch ein Downgrade der Treiber auf eine vorherige Version sowie eine komplette Bereinigung von den NVidia Treibern und Neuinstallation brachten nun letztlich keine Besserung.

Denn wie oben geschrieben tritt der unfreiwillige Neustart des Rechners weiterhin unregelmäßig auf. Hierbei kann man grob sagen 1 - 2x am Abend.


Für Ideen oder Hilfen wäre ich sehr sehr dankbar.

Verified Answer
  • Hi Christian,

    Die Grafikkarte kannst du doch bestimmt allein tauschen oder? ;)

    Schick mir deine Adresse via private Nachricht dann schick ich dir die Karte (kostenfrei) zu. Wichtig ist, dass das Ersatzteil mit UPS versendet wird. Es sollte also jemand zu Hause sein, wenn die Kollegen vor der Tür stehen. UPS kommt nach der Lieferung den nächsten Tag automatisch vorbei um das defekte Teil abzuholen.

    Grüße

    Tom

All Replies
  • Habe soeben noch einmal per BlueScreenView geschaut was da passiert.

    Er wirft mir folgende Daten dazu aus:

    Bug Check Code: 0x00000116
    Parameter 1: fffffa80`1745f2c0
    Parameter 2: fffff880`0fffc7a0
    Parameter 3: ffffffff`c000009a
    Parameter 4: 00000000`00000004
    Caused By Driver: dxgkrnl.sys
    Caused By Address: dxgkrnl.sys+5d140
    Processor: x64

  • Hallo,

    ich empfehle dir mal den Blogbeitrag:
    http://de.community.dell.com/techcenter/b/weblog/archive/2014/05/01/frag-tom-folge-4-unterst-252-tzung-bei-bluescreen-0x116.aspx

    Sehr informativ! ;)

    Bitte alles darin beachten. Mach bitte, sofern nicht geschehen ein Bios Update. Installiere den Treiber von der Dell Website, wenn dieser diesen Fehler auch verursacht, nutze bitte den neusten stable NVidia Treiber.

    Hast du eventuell schon weitere Dinge unternommen die du noch nicht mitgeteilt hast?

    Grüße

    Tom

  • Hallo Tom und danke für deine Antwort.

    BIOS Update hatte ich vor einem Monat auf A11 durchgeführt.

    die Treiber zu meiner Produktnummer hatte ich im Dell Service Center auch ausprobiert zu der Zeit. Dies brachte keine Besserung. Seitdem nutze ich die stable Versionen von NVidia. Momentan die aktuelle 340.

    Gestern Abend hatte ich noch einmal, da ich dies im Netz als lohnenswerten Test bei dem Problem beschrieben fand, Memtest86+ 5.01 per USB Boot laufen lassen. Während des Tests steigt auch das Videosignal aus. Der Test läuft aber weiter, sprich es kommt zu keinem automatischen Neustart. Erst wenn ich mit Esc den Test "blind" beende startet der Rechner normal neu.

    Weiterhin nutze ich AIDA64 mit meiner Logitech Tastatur, um mir die Temperatur und Auslastungswerte von meinen 4 CPUs, RAM, 2 GPUs und dem Videospeicher anzuzeigen. Dabei ist es so, dass bei dem Freeze kurz vor dem automatischen Neustart die Anzeigen für die beiden GPUs keine Daten mehr erhalten und ausgeblendet werden.

    Ich werde nach der Arbeit entsprechend dem Blog verfahren und die Ergebnisse am Abend mitteilen. Sollte es wirklich die GraKa sein, dann stellt sich mir die Frage bezüglich Garantie / Austausch. Der Rechner ist knapp 1,5 Jahre alt, mein Service Paket ist nach einem Jahr allerdings ausgelaufen. Dies würde dann in die Herstellergarantie fallen, oder wie genau wäre dann in dem Fall die weitere Vorgehensweise?

    Danke bereits für deine weitere Unterstützung.

  • Hallo,

    Danke für die Ausführungen, da hast du ja schon eine Menge getan. da du 2 Grafikkarte hast, ist es vorteilhaft die defekte auszuschließen - also beide testen.

    Jetzt würde ja die Gewährleistung greifen. der Haken bei Gewährleistung ist ja, dass du nach 6 Monaten in der Pflicht bist nachzuweisen, dass der Defekt schon beim Kauf vorhanden war. Da machen wir uns nichts vor, dass ist unmöglich. Wenn es allerdings soweit ist, würde ich die Angelegenheit hier intern auf jeden Fall abklären.

    Grüße

    Tom

  • Hey Tom.

    Es handelt sich ja um eine Geforce GTX 690. Also keine zwei Karten, sondern eine die im Grunde ja aus zwei 680 GPUs besteht. Also das ermitteln welcher eventuell einen Fehler hat ist da dann sicher irrelevant, da es nur eine GraKa ist.

    Bezüglich der Beweispflicht Stimme ich dir da natürlich zu und ist mir bekannt. Deswegen ja auch die Frage wie ich das dahingehend als Kunde mit Dell lösen kann. Inwiefern würdest du bzw wir das intern abklären oder auf welchen Kommunikationsweg würden wir da fortfahren?

    Grüße

    Christian 

  • Hi,

    Gut... mit der 690 geht das schlecht - lässt sich ja nicht teilen - bzw. nach dem Teilen schlecht wieder einsetzen. ;)

    Bzgl. Abklärung werde ich wohl mit ein paar Kollegen reden müssen, damit hast du im Grunde genommen nichts zu tun. Wenn du heute Abend soweit nachgeschaut hast, kannst du mir schon mal eine private Nachricht mit der Servicetag schreiben...

    Grüße

    Tom

  • Huhu,

    wie ich dir geschrieben habe ist meine Memory.dmp 800MB groß. Werde sie nun also mal löschen und sobald der Fehler nochmal auftritt bei OSR eine Analyse machen. Hatte halt gehofft den Fehler von gestern oder so direkt nutzen zu können, aber leider ist die Datei halt zu groß :).

  • Ok....

    seit jetzt ist es so, dass der Rechner auch im normalen Betrieb aussteigt. Jetzt gerade bereits 3x innerhalb von etwa 45 Minuten. Ein memory.dmp wird nicht erstellt, die alte ist gelöscht.
    Allerdings habe ich nun einen Minidump genommen von gestern Abend gegen 21:00. Ich wüsste nicht wie ich sonst momentan an den Dump kommen kann, da keiner erstellt wird.

    Das Aussteigen im normalen Betrieb in Windows ohne Spiel oder sonstige große Anwendungen stellt sich jetzt so dar, dass der Bildschirm in den Power Save Mode geht da er kein Videosignal mehr bekommt und dabei teils der Rechner neu startet mit der Meldung beim Hochfahren er wäre nicht normal heruntergefahren oder er einfach weiterläuft, ich aber nichts mehr sehe. Reproduzierbar ist es weiterhin nicht.

    Wie beim Blog habe ich nun verfahren. Die Instruktionen auf der Microsoft Helpseite habe ich manuell durchgeführt ohne das Programm.

    Hier einmal die Analyse des Minidump:

    Crash Dump Analysis provided by OSR Open Systems Resources, Inc. (http://www.osr.com)
    Online Crash Dump Analysis Service
    See http://www.osronline.com for more information
    Windows 7 Kernel Version 7601 (Service Pack 1) MP (8 procs) Free x64
    Product: WinNt, suite: TerminalServer SingleUserTS
    Built by: 7601.18409.amd64fre.win7sp1_gdr.140303-2144
    Machine Name:
    Kernel base = 0xfffff800`03454000 PsLoadedModuleList = 0xfffff800`03697890
    Debug session time: Wed Jul 30 14:52:55.344 2014 (UTC - 4:00)
    System Uptime: 0 days 0:37:33.156
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************
    
    VIDEO_TDR_FAILURE (116)
    Attempt to reset the display driver and recover from timeout failed.
    Arguments:
    Arg1: fffffa801745f2c0, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
    Arg2: fffff8800fffc7a0, The pointer into responsible device driver module (e.g. owner tag).
    Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
    Arg4: 0000000000000004, Optional internal context dependent data.
    
    Debugging Details:
    ------------------
    
    TRIAGER: Could not open triage file : e:\dump_analysis\program\triage\modclass.ini, error 2
    
    FAULTING_IP: 
    nvlddmkm+9a57a0
    fffff880`0fffc7a0 48ff25f94eedff  jmp     qword ptr [nvlddmkm+0x87a6a0 (fffff880`0fed16a0)]
    
    DEFAULT_BUCKET_ID:  GRAPHICS_DRIVER_TDR_FAULT
    
    BUGCHECK_STR:  0x116
    
    PROCESS_NAME:  System
    
    CURRENT_IRQL:  0
    
    STACK_TEXT:  
    fffff880`02f17a48 fffff880`10342140 : 00000000`00000116 fffffa80`1745f2c0 fffff880`0fffc7a0 ffffffff`c000009a : nt!KeBugCheckEx
    fffff880`02f17a50 fffff880`10315867 : fffff880`0fffc7a0 fffffa80`16374000 00000000`00000000 ffffffff`c000009a : dxgkrnl!TdrBugcheckOnTimeout+0xec
    fffff880`02f17a90 fffff880`10341f4f : fffffa80`ffffd84d ffffffff`fffe7960 fffffa80`1745f2c0 fffff880`0f637f3c : dxgkrnl!DXGADAPTER::Reset+0x2a3
    fffff880`02f17b40 fffff880`0f63803d : fffffa80`0d8e5010 00000000`00000080 00000000`00000000 fffffa80`1636c410 : dxgkrnl!TdrResetFromTimeout+0x23
    fffff880`02f17bc0 fffff800`0376573a : 00000000`04b00031 fffffa80`163b3060 fffffa80`0d32a890 fffffa80`163b3060 : dxgmms1!VidSchiWorkerThread+0x101
    fffff880`02f17c00 fffff800`034ba8e6 : fffff800`03644e80 fffffa80`163b3060 fffff800`03652cc0 fffffa80`00000040 : nt!PspSystemThreadStartup+0x5a
    fffff880`02f17c40 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxStartSystemThread+0x16
    
    
    STACK_COMMAND:  .bugcheck ; kb
    
    FOLLOWUP_IP: 
    nvlddmkm+9a57a0
    fffff880`0fffc7a0 48ff25f94eedff  jmp     qword ptr [nvlddmkm+0x87a6a0 (fffff880`0fed16a0)]
    
    SYMBOL_NAME:  nvlddmkm+9a57a0
    
    FOLLOWUP_NAME:  MachineOwner
    
    MODULE_NAME: nvlddmkm
    
    IMAGE_NAME:  nvlddmkm.sys
    
    DEBUG_FLR_IMAGE_TIMESTAMP:  53b4446a
    
    FAILURE_BUCKET_ID:  X64_0x116_IMAGE_nvlddmkm.sys
    
    BUCKET_ID:  X64_0x116_IMAGE_nvlddmkm.sys
    
    Followup: MachineOwner
    ---------
  • Und hier auch noch der Raw Stack Content, bereinigt von den Leerzeilen.

    fffff880`02f17a48  fffff880`10342140 dxgkrnl!TdrBugcheckOnTimeout+0xec
    fffff880`02f17a60  fffff880`0fffc7a0 nvlddmkm+0x9a57a0
    fffff880`02f17a88  fffff880`10315867 dxgkrnl!DXGADAPTER::Reset+0x2a3
    fffff880`02f17a90  fffff880`0fffc7a0 nvlddmkm+0x9a57a0
    fffff880`02f17b10  fffff880`0f637f3c dxgmms1!VidSchiWorkerThread
    fffff880`02f17b38  fffff880`10341f4f dxgkrnl!TdrResetFromTimeout+0x23
    fffff880`02f17b58  fffff880`0f637f3c dxgmms1!VidSchiWorkerThread
    fffff880`02f17b88  fffff880`0f638514 dxgmms1!VidSchiSubmitQueueCommand+0x50
    fffff880`02f17b98  fffff880`0f637f00 dxgmms1!VIDMM_LINEAR_POOL::FindAdjacentBlocksOnFreeList+0x68
    fffff880`02f17bb8  fffff880`0f63803d dxgmms1!VidSchiWorkerThread+0x101
    fffff880`02f17be0  fffff800`03644e80 nt!KiInitialPCR+0x180
    fffff880`02f17bf8  fffff800`0376573a nt!PspSystemThreadStartup+0x5a
    fffff880`02f17c38  fffff800`034ba8e6 nt!KxStartSystemThread+0x16
    fffff880`02f17c40  fffff800`03644e80 nt!KiInitialPCR+0x180
    fffff880`02f17c50  fffff800`03652cc0 nt!KiInitialThread

    Kann es eigentlich auch sein, dass es an dem Netzteil liegt irgendwie? Habe davon gelesen, als ich bei google rumgesucht hatte. Ist hier in diesem Thread erwähnt worden.

    http://www.computerbase.de/forum/showthread.php?t=863243&p=9458338#post9458338

  • Hi,

    Die Möglichkeit mit dem Netzteil besteht. Das muss allerdings eine relativ einmalige Sache gewesen sein. Ich kenne es ausschließlich von Grafikkarten.

    Da ist ja auch das Timeout:

    fffff880`02f17b38  fffff880`10341f4f dxgkrnl!TdrResetFromTimeout+0x23

    Ich kläre es aber und melde mich ;)

    Grüße
    Tom

  • Ok, schonmal sehr gut zu wissen, dass das Problem sogesehen eindeutig identifiziert ist. So hat das ewige rumprobieren endlich ein Ende. In dem Sinne auch vielen Dank für die schnelle und ausdauernde Hilfe :).

    Dann warte ich auf deine Rückmeldung und dann sehen wir weiter.

    Grüße

    Christian

  • Hi Christian,

    Die Grafikkarte kannst du doch bestimmt allein tauschen oder? ;)

    Schick mir deine Adresse via private Nachricht dann schick ich dir die Karte (kostenfrei) zu. Wichtig ist, dass das Ersatzteil mit UPS versendet wird. Es sollte also jemand zu Hause sein, wenn die Kollegen vor der Tür stehen. UPS kommt nach der Lieferung den nächsten Tag automatisch vorbei um das defekte Teil abzuholen.

    Grüße

    Tom