¿Las GPU se desgastan con el uso intensivo?

¿Las GPU se desgastan con el uso intensivo?

Si planea juegos intensivos, computación GPU, renderizado de gráficos, Folding@home o minería criptográfica en su GPU, es posible que le preocupe que su GPU se desgaste con un uso intensivo. ¿Pero lo hará? investigaremos

si pero es dificil

Gran parte de la información que encuentra en Internet sobre la vida útil de las tarjetas gráficas es anecdótica, y los números pueden variar mucho según a quién le pregunte. Con cientos de modelos de tarjetas gráficas diferentes lanzados durante la última década, es difícil reducir los datos de tarjetas tan diferentes a meras generalizaciones.

Lo que sabemos hasta ahora es esto: según el informe de 2020 del minorista alemán , las tarjetas gráficas más recientes tienen una tasa general de fallas de alrededor del 2-5 % (medida en devoluciones al minorista). Y en 2021, Nvidia todavía estaba lanzando actualizaciones de controladores para tarjetas que tenían entre 9 y 10 años (como la serie GTX 600), por lo que puede esperar una década de una tarjeta GPU bien diseñada, aunque estos podrían ser valores atípicos, ya que Ya veré más lejos.

Independientemente de los números, la física pesada está en el trabajo aquí. Los materiales y componentes utilizados en las tarjetas GPU no son mágicos: cuanto más los usa, más rápido se desgastan y es más probable que fallen por completo. Así que el uso intensivo afecta la esperanza de vida.

El hecho de que vea una falla en su tarjeta GPU depende de variables completamente diferentes, incluida la cantidad de uso de la GPU, la naturaleza y el alcance de las fluctuaciones de temperatura en el circuito, cuántas veces se encendió y apagó la tarjeta y qué tan limpia el entorno operativo es.

Dado que la tarjeta GPU es un dispositivo complejo con muchas partes, cada una puede fallar o degradarse a su manera. Echaremos un vistazo a algunas de las partes principales de una tarjeta GPU y veremos cómo pueden desgastarse con un uso intensivo con el tiempo.

Lo primero es lo primero: ventiladores de refrigeración

De todas las partes de una tarjeta gráfica que pueden fallar en primer lugar, debemos señalar los ventiladores (o ventiladores) de refrigeración que son las partes móviles físicas. Los ventiladores enfrían su GPU extrayendo aire caliente del chip GPU (con disipador de calor) para que pueda seguir funcionando.

¿Por qué es malo el calor? Con suficiente calor, los transistores no funcionan correctamente , lo que significa que la tarjeta GPU no funcionará. Con aún más calor, los transistores en los microcircuitos de la tarjeta pueden dañarse irreparablemente .

Con el tiempo, los ventiladores de enfriamiento a menudo se obstruyen con polvo, lo que reduce su capacidad para mover el aire de manera eficiente. O los ventiladores pueden fallar por completo si falla la lubricación interna. Cualquier script elevará la temperatura de la GPU.

Cada GPU se protege contra el sobrecalentamiento con estrangulamiento térmico, que ralentiza la GPU para reducir su temperatura de funcionamiento. Esto limita severamente el rendimiento. Entonces, si tiene una GPU que repentinamente hace más ruido de lo normal (el ventilador gira más rápido) o funciona peor, limpie a fondo los ventiladores de refrigeración y el disipador de calor de la GPU con aire comprimido.

Si el ventilador de enfriamiento de la GPU ha fallado por completo, generalmente se puede reemplazar si puede encontrar un ventilador similar en el proveedor de piezas de su computadora.

Otro sospechoso: pasta térmica defectuosa

Entre cada disipador de calor y el chip de la GPU hay una capa de material termoconductor, como masilla o pasta, para ayudar a transferir el calor del chip de la GPU al disipador de calor.

Con el tiempo, la pasta térmica puede agrietarse o perder eficacia. Cuando esto sucede, el disipador de calor no se enfría tan eficientemente y la temperatura de la GPU aumenta. Como vimos en la sección de ventiladores anterior, las altas temperaturas de la GPU provocan un estrangulamiento térmico, lo que ralentiza la GPU.

La mejor solución en este caso es reemplazar la pasta térmica usted mismo. Puede comprar pasta térmica de proveedores de hardware de computadora.

Fallos en otros componentes, soldadura

Además del chip GPU, la tarjeta gráfica incluirá docenas de otros componentes electrónicos como condensadores, resistencias, chips de memoria y más. Cualquiera de estos podría fallar potencialmente debido al uso intensivo o la exposición a demasiado calor. Algunos tienen más probabilidades de fallar que otros.

En particular, los capacitores fallan con el tiempo . Son sensibles a las frecuentes fluctuaciones de temperatura y algunas presentan defectos en la primera producción. Si es lo suficientemente inteligente como para solucionar problemas de condensadores, puede reemplazar potencialmente los condensadores defectuosos en una tarjeta GPU si puede encontrar piezas de repuesto equivalentes.

Además, la soldadura que conecta los chips y los componentes a la placa de circuito de la tarjeta GPU puede envejecer y agrietarse con el tiempo debido a cambios frecuentes de temperatura, manipulación brusca, almacenamiento inadecuado o sobrecalentamiento. Entonces, sí, el uso intensivo de la GPU puede aumentar el riesgo de fallas en la unión de soldadura. Reparar juntas de soldadura defectuosas puede ser técnicamente difícil, pero no imposible .

Fallos en el propio chip GPU

Entonces, la pregunta sigue siendo: ¿Puede un chip GPU desgastarse con el tiempo con un uso intensivo? La respuesta es sí, en teoría, en circunstancias extremas. Pero lo más probable es que vea fallar otro componente de la tarjeta gráfica mucho antes.

El chip GPU de su tarjeta de video contiene millones o miles de millones de transistores grabados en una pieza de silicio. Los transistores envejecen con el tiempo , lo que afecta su rendimiento. Cuando fallan suficientes transistores, el chip fallará.

Según Semiconductor Engineering , hay varias razones principales por las que los transistores fallan con el tiempo debido al envejecimiento ( uno de los cuales es el calor ), y cuanto más pequeño es el elemento en el chip, más probable es que se produzcan errores. Los expertos sospechan que los chips de computadora fabricados hoy no durarán tanto como los fabricados en la década de 1990, pero predecir la vida útil exacta sigue siendo una suposición porque la tecnología es muy nueva.

Actualmente, NVIDIA no publica clasificaciones MTBF (Mean Time Between Failures) para sus tarjetas gráficas de consumo, pero la empresa las  publica para algunos de sus aceleradores de gráficos industriales y comerciales. Por ejemplo, la hoja de datos del acelerador de GPU Tesla K20X establece que el MTBF de la tarjeta (a 35 °C/95 F) es de 14,7 años para un «entorno no controlado» y de 23,8 años para un «entorno controlado». (Tenga en cuenta que, en general, el hardware de gráficos industriales se considera más confiable y más capaz de soportar un uso intensivo que el hardware de gráficos de consumo).

Curiosamente, podemos comparar este número teórico con los datos exactos obtenidos en el campo. Uno de los pocos estudios empíricos sobre la vida útil de la GPU proviene de un artículo de 2020 titulado » GPU Lifespan on the Titan Supercomputer: Survival and Reliability Analysis «, escrito por el Laboratorio Nacional de Oak Ridge. El documento informa la confiabilidad de 18,688 tarjetas GPU Nvidia K20X Kepler utilizadas en la supercomputadora Cray XK7 Titan ahora retirada durante casi 7 años (2012-2019).

Después de algunas fallas iniciales debido a problemas de conectividad, descubrieron que las tarjetas gráficas XK7 eran relativamente confiables hasta 2016 (alrededor de 3 o 4 años), cuando muchas de ellas comenzaron a fallar. ¿Pero sabes que? Rastrearon la mayoría de las fallas en el primer lote de tarjetas (antes del reemplazo) a una resistencia defectuosa en el PCB de la tarjeta gráfica, no al chip GPU en sí. En general, los autores del estudio encontraron que el MTBF de las tarjetas gráficas K20X muy usadas es de alrededor de 3 años (no 14-23 años como se indica en la hoja de datos de Nvidia), y algunas de las tarjetas más populares en el núcleo son las primeras en fallar. Llegaron a la conclusión de que «la confiabilidad de la GPU depende de la disipación de calor».

Por lo tanto, es muy probable que si usa su tarjeta gráfica con tanta fuerza como una de las supercomputadoras más grandes del mundo (en ese momento), se desgastará más rápido y otros componentes como los ventiladores y las resistencias fallarán mucho antes de que falle el chip GPU. el tiempo que obtenga depende de factores que no podemos predecir.

Después de todo, el calor es el enemigo.

Al final, de todas las fuentes que hemos leído, el factor más importante para determinar cuánto durará una tarjeta GPU es qué tan caliente está. Cuanto más caliente esté la tarjeta, más rápido se degradarán todos sus componentes. Además, cuanto más caliente está la tarjeta, más reduce el rendimiento para evitar una falla catastrófica. Una buena refrigeración prolonga la vida de su tarjeta y mejora su rendimiento.

Entonces, ya sea que le gusten las criptomonedas o los juegos, siempre que su tarjeta gráfica se mantenga lo suficientemente fría con ventiladores que funcionen limpios y pasta térmica efectiva, probablemente tendrá una tarjeta de alto rendimiento que, si tiene suerte, puede durar tanto tiempo como desactualizado y se actualiza.

Si está considerando comprar una GPU usada, definitivamente debe tener en cuenta su historial, incluido cómo la manejó y usó su propietario. Las tarjetas más utilizadas (las que funcionan ahora) tienen más probabilidades de funcionar bien a corto plazo, pero son más propensas a fallar a largo plazo. No podemos precisar la vida útil de la tarjeta, pero el uso intensivo definitivamente desgasta la tarjeta gráfica más rápido.

¡Buena suerte!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *