Verschleißen GPUs durch starke Beanspruchung?

0
147
Maxx-Studio/Shutterstock.com

Wenn Sie auf Ihrer Grafikkarte intensives Gaming, GPU-Computing, Grafik-Rendering, Folding@home oder Krypto-Mining planen, machen Sie sich möglicherweise Sorgen, dass sich Ihre GPU durch die starke Nutzung abnutzt . Aber wird es? Wir werden das untersuchen.

Ja, aber es ist kompliziert

Die meisten Informationen über die Lebensdauer von Grafikkarten, die Sie online finden, sind anekdotisch, wobei die Zahlen stark variieren können, je nachdem, wen Sie fragen. Mit Hunderten von verschiedenen Grafikkartenmodellen, die in den letzten zehn Jahren auf den Markt gebracht wurden, ist es schwierig, Daten zu derart unterschiedlichen Karten zu einfachen Verallgemeinerungen zusammenzufassen.

Bisher wissen wir Folgendes: Laut einem Bericht eines deutschen Händlers aus dem Jahr 2020 haben die neuesten Grafikkarten insgesamt eine Ausfallrate von etwa 2-5% (gemessen in Rücksendungen an den Händler). Und im Jahr 2021 hat Nvidia immer noch Treiber-Updates für Karten bereitgestellt, die etwa 9-10 Jahre alt waren (wie die GTX-600-Serie), sodass Sie von einer gut behandelten GPU-Karte möglicherweise ein Jahrzehnt der Nutzung erwarten können – obwohl diese könnten Ausreißer sein, wie wir weiter unten sehen werden.

Unabhängig von den Zahlen ist harte Physik am Werk. Die Materialien und Komponenten, die bei der Zusammensetzung von GPU-Karten verwendet werden, sind nicht magisch: Je öfter Sie sie verwenden, desto schneller verschlechtern sich die Teile und desto wahrscheinlicher werden sie vollständig ausfallen. Starke Nutzung wirkt sich also auf die Lebensdauer aus.

Wie Sie sehen werden, verkürzt Krypto-Mining die Lebensdauer einer Grafikkarte. socrates471/Shutterstock.com

Ob Sie einen Fehler in Ihrer GPU-Karte sehen, hängt von sehr unterschiedlichen Variablen ab, einschließlich der genauen Belastung der GPU, Art und Grad der Temperaturschwankungen in der Schaltkreise, wie oft die Karte ein- und ausgeschaltet wurde und wie sauber die Betriebsumgebung ist.

Werbung

Da eine GPU-Karte ein komplexes Gerät mit vielen Teilen ist, kann jedes auf unterschiedliche Weise ausfallen oder sich verschlechtern. Wir werden mehrere Hauptteile einer GPU-Karte durchgehen und untersuchen, wie sie sich im Laufe der Zeit durch starke Nutzung abnutzen könnten.

First to Go: Kühlgebläse

Von allen Teilen einer Grafikkarte, die wahrscheinlich zuerst ausfallen, müssen wir auf die Lüfter (oder Lüfter) hinweisen, bei denen es sich um physisch bewegliche Teile handelt. Lüfter halten Ihre GPU kühl, indem sie heiße Luft vom GPU-Chip (mit einem Kühlkörper) wegleiten, damit er weiter funktionieren kann.

FeelGoodLuck/Shutterstock.com

Warum ist Hitze schlecht? Bei genügend Wärme arbeiten Transistoren nicht richtig, was bedeutet, dass die GPU-Karte nicht funktioniert. Bei noch mehr Hitze können die Transistoren in Chips auf der Karte dauerhaft beschädigt werden.

Im Laufe der Zeit verstopfen Kühlventilatoren oft mit Staub, wodurch ihre Fähigkeit, Luft effizient zu bewegen, verringert wird. Oder die Lüfter fallen komplett aus, wenn ein internes Schmiermittel ausfällt. Beide Szenarien erhöhen die Temperatur der GPU.

VERWANDTWas ist Thermal Throttling?

Jede GPU schützt sich vor Überhitzung, indem sie eine thermische Drosselung verwendet, die den Betrieb der GPU verlangsamt, um die Betriebstemperatur zu senken. Dadurch wird die Leistung stark eingeschränkt. Wenn Sie also eine GPU haben, die plötzlich lauter als gewöhnlich ist (der Lüfter dreht sich schneller) oder schlechter arbeitet, reinigen Sie die Lüfter und den Kühlkörper Ihrer GPU gründlich mit Druckluft.

Wenn ein GPU-Lüfter vollständig ausgefallen ist, können Sie ihn normalerweise ersetzen, wenn Sie einen gleichwertigen Lüfter bei einem Computerteilehändler finden Ihr schmutziger Desktop-Computer

Ein weiterer Verdächtiger: Fehlerhafte Wärmeleitpaste

Zwischen jedem Kühlkörper und jedem GPU-Chip befindet sich eine Schicht aus wärmeleitendem Material, z. B. ein Pad aus Kitt oder Paste, das die Wärmeübertragung vom GPU-Chip zum Kühlkörper unterstützt.

VERWANDTE Wie viel Wärmeleitpaste sollte ich auftragen? Meine CPU?

Im Laufe der Zeit kann Wärmeleitpaste reißen oder ihre Wirksamkeit verlieren. In diesem Fall kühlt der Kühlkörper nicht so effektiv und die GPU-Temperatur steigt. Wie wir oben im Lüfterabschnitt gesehen haben, führen hohe GPU-Temperaturen zu einer thermischen Drosselung, die Ihre GPU verlangsamt.

Arctic MX-4 GPU-Wärmeleitpaste

Eine hoch angesehene Wärmeleitpaste für GPUs.

Amazon

$ 11.99 Fehler in anderen Komponenten, Lötstellen

Neben dem GPU-Chip enthält eine Grafikkarte Dutzende anderer elektronischer Komponenten wie Kondensatoren, Widerstände, Speicherchips und mehr. Jede davon könnte möglicherweise durch starke Beanspruchung oder Einwirkung von zu viel Hitze ausfallen. Einige scheitern eher als andere.

Andrei Kuzmik/Shutterstock.com

Insbesondere Kondensatoren sind im Laufe der Zeit störanfällig. Sie reagieren empfindlich auf häufige Temperaturänderungen und einige sind bei der Erstproduktion defekt. Wenn Sie geschickt genug sind, um Kondensatorprobleme zu beheben, können Sie möglicherweise defekte Kondensatoren auf einer GPU-Karte ersetzen, wenn Sie gleichwertige Ersatzteile finden.

Außerdem kann das Lötmittel, das Chips und Komponenten mit der Leiterplatte Ihrer GPU-Karte verbindet, altern und im Laufe der Zeit durch häufige Temperaturänderungen, grobe physische Handhabung, unsachgemäße Lagerung oder zu heißes Laufen reißen. Also ja, eine starke GPU-Nutzung könnte das Risiko eines Lötstellenversagens erhöhen. Das Reparieren schlechter Lötstellen kann technisch schwierig sein, ist aber nicht unmöglich.

Fehler im GPU-Chip selbst

Bleibt also die Frage: Kann sich ein GPU-Chip bei starker Beanspruchung irgendwann abnutzen? Die Antwort lautet ja, theoretisch, unter extremen Umständen. Aber Sie werden den Ausfall einer anderen Komponente auf der Grafikkarte wahrscheinlich lange vor diesem Zeitpunkt sehen.

Werbung

Der GPU-Chip Ihrer Grafikkarte enthält Millionen oder Milliarden von Transistoren, die in ein Stück Silizium geätzt sind. Transistoren altern mit der Zeit, was ihre Leistung beeinträchtigt. Wenn sich genügend Transistoren schlecht verhalten, fällt der Chip aus.

Laut Semiconductor Engineering gibt es mehrere Hauptgründe, warum Transistoren im Laufe der Zeit durch Alterung (einer davon ist Wärme) ausfallen, und die Fehler sind umso wahrscheinlicher, je kleiner die Strukturgröße auf dem Chip ist. Experten vermuten, dass Computerchips, die heute hergestellt werden, nicht so lange halten wie Chips, die in den 1990er Jahren hergestellt wurden, aber die Vorhersage einer genauen Lebensdauer ist immer noch Spekulation, da die Technologie so neu ist.

ZinetroN/Shutterstock.com

Derzeit veröffentlicht NVIDIA keine MTBF-Schätzungen (Mean Time Between Failure) für seine Consumer-Grafikkarten, aber das Unternehmen veröffentlicht sie für einige seiner industriellen und geschäftlichen Grafikbeschleuniger. Beispielsweise gibt das Datenblatt für den Tesla K20X GPU-Beschleuniger die MTBF für die Karte (bei einer Temperatur von 35 °C/95 °F) mit 14,7 Jahren für eine „unkontrollierte Umgebung“ an. und 23,8 Jahre für eine “kontrollierte Umgebung” (Beachten Sie, dass im Allgemeinen erwartet wird, dass industrielle Grafikhardware robuster ist und einer starken Beanspruchung besser standhält als Consumer-Grafikhardware.)

Interessanterweise können wir diese theoretische Zahl mit harten Daten aus der Praxis vergleichen. Eine der wenigen empirischen Studien zur GPU-Lebensdauer stammt aus dem Jahr 2020 mit freundlicher Genehmigung von „GPU Lifetimes on Titan Supercomputer: Survival Analysis and Reliability“. verfasst von Oak Ridge National Labs. Das Papier berichtet über die Zuverlässigkeit der 18.688 Nvidia K20X Kepler GPU-Karten, die im inzwischen ausgemusterten Supercomputer Cray XK7 Titan über einen Zeitraum von fast 7 Jahren (2012-2019) verwendet wurden.

Der Supercomputer Cray XK7 lieferte wertvolle Daten über die Lebensdauer der GPU. ORNL

Nach einigen anfänglichen Problemen aufgrund von Verbindungsproblemen stellten sie bis 2016 (etwa 3-4 Jahre später) eine relativ hohe Zuverlässigkeit der XK7-Grafikkarten fest, als viele anfingen zu versagen. Aber rate mal was? Sie führten die meisten Fehler in der ersten Charge von Karten (vor dem Austausch) auf einen fehlerhaften Widerstand auf der Platine der Grafikkarte zurück, nicht auf den GPU-Chip selbst. Insgesamt stellten die Autoren der Studie fest, dass die durchschnittliche MTBF der stark genutzten GPU-Karten des K20X bei einigen etwa 3 Jahre (nicht 14-23 Jahre, wie im Datenblatt von Nvidia angegeben) beträgt der heißesten Karten im Kern fallen zuerst aus. Sie kamen zu dem Schluss: „Die Zuverlässigkeit der GPU hängt von der Wärmeableitung ab.“

Werbung

Die Wahrscheinlichkeit ist also hoch, dass, wenn Sie Ihre Grafikkarte so intensiv wie einen der (damals) größten Supercomputer der Welt nutzen, sie schneller verschleißt und andere Komponenten wie Lüfter und Widerstände lange vorher ausfallen der GPU-Chip selbst. Wie lange Sie genau bleiben, hängt von Faktoren ab, die wir nicht vorhersagen können.

Letztendlich ist Hitze der Feind

Letztendlich ist nach allen Quellen, die wir gelesen haben, der wichtigste Entscheidungsfaktor für die Lebensdauer einer GPU-Karte, wie heiß sie läuft. Je heißer die Karte, desto schneller verschlechtern sich alle ihre Komponenten. Je heißer die Karte ist, desto mehr drosselt sie die Leistung, um einen katastrophalen Ausfall zu verhindern. Eine gute Kühlung verlängert sowohl die Lebensdauer Ihrer Karte als auch ihre Leistung.

RELATEDEinen gebrauchten Grafikprozessor kaufen? Hier ist, worauf Sie achten sollten

Ob Sie also Krypto abbauen oder spielen, wenn Sie Ihre GPU-Karte mit sauberen, funktionierenden Lüftern und effektiver Wärmeleitpaste einigermaßen kühl halten, haben Sie wahrscheinlich eine hohe Leistung Karte, die, wenn Sie Glück haben, so lange hält, bis sie veraltet ist und Sie ein Upgrade durchführen.

Wenn Sie den Kauf einer gebrauchten GPU planen, sollten Sie auf jeden Fall ihre Geschichte berücksichtigen, einschließlich der Art und Weise, wie ihr Besitzer sie behandelt und verwendet hat. Stärker genutzte Karten (die jetzt funktionieren) werden wahrscheinlich kurzfristig gut funktionieren, sind aber langfristig anfälliger für Ausfälle. Wir können die Lebensdauer einer Karte nicht genau beziffern, aber bei starker Nutzung verschleißen Grafikkarten definitiv schneller.

Viel Glück!

VERBINDUNG : Ist es sicher, gebrauchte GPUs von Kryptowährungs-Minern zu kaufen?

WEITER LESEN

  • › Ihre WLAN-Informationen befinden sich in den Datenbanken von Google und Microsoft: Sollte es Sie interessieren?
  • › Lesen Sie dies, bevor Sie ein Amazon Fire Tablet kaufen
  • › Googles erster Assistent: Der Tod von Google Now
  • › Apples M1 Ultra Chip wird Mac-Desktops aufladen
  • › Sie fahren falsch herunter: So fahren Sie Windows wirklich herunter
  • › Warum ist das Linux-Maskottchen ein Pinguin?