Conecta con nosotros

Opinión

Los efectos de las altas temperaturas en los discos duros

Publicado el

Los discos duros empresariales modernos están diseñados para temperaturas de funcionamiento entre 5 y 60 grados centígrado. Los fabricantes recomiendan que no se utilicen en el extremo superior de este rango de forma permanente porque hacerlo reducirá la vida útil de las unidades y planteará un riesgo de mayores tasas de falla. Entonces, ¿qué sucede con los discos duros a altas temperaturas? ¿Y pueden estos efectos compensarse posteriormente trabajando a temperaturas más bajas?

Como la mayoría de los componentes de servidores y sistemas de almacenamiento, los discos duros se calientan durante el funcionamiento, especialmente bajo cargas pesadas. Para permitir a los administradores monitorizar la temperatura de sus unidades, los discos duros modernos tienen un sensor de temperatura interno que entrega sus lecturas a través de SMART (tecnología de informes y análisis de autocontrol), de modo que se puedan leer utilizando los recursos integrados en el sistema operativo, herramientas de administración del sistema o las herramientas utilizadas para administrar controladores RAID y adaptadores de bus host. Además, existe una gran cantidad de herramientas especializadas para esta tarea disponibles tanto para Windows como para Linux.

En el caso de un sobrecalentamiento del disco duro, se corre el riesgo de un funcionamiento reducido con mayores posibilidades de fallo, dado que sus componentes electrónicos y mecánicos están diseñados para operar correctamente solo dentro de un determinado rango de temperatura. Además, los componentes mecánicos se desgastan más rápidamente, por lo cual la fiabilidad y vida útil del disco duro disminuye seriamente. Particularmente, el giro del eje de los discos duros tiene el mayor riesgo de fallo, puesto a que en altas temperaturas el aceite utilizado como lubricante se vuelve demasiado líquido y puede salirse del rodamiento. Por lo tanto, es esencial controlar la temperatura del disco duro para evitar el sobrecalentamiento y garantizar que las unidades brinden un servicio prolongado y fiable.

¿Cuál es la temperatura óptima?

Los fabricantes de unidades de disco duro suelen especificar el rango de temperatura en el cual sus unidades funcionan adecuadamente. En el caso de los HDD empresariales, suponiendo que se utilizan en salas de servidores o centros de datos con aire acondicionado, las unidades están diseñadas para temperaturas de funcionamiento entre 5 y 60 grados centígrados. En cuanto a los discos duros NAS, sus especificaciones son de 5 a 65 grados centígrados y las de videovigilancia son de 0 a 70 grados centígrados, dado que los sistemas de videovigilancia no siempre se instalan en habitaciones con condiciones ambientales estables.

En realidad, estas especificaciones se refieren únicamente a la capacidad operativa, pero en situaciones donde las unidades operan en el rango de temperatura superior durante un período de tiempo más largo, se ve afectada negativamente su durabilidad. Normalmente se puede tolerar un breve aumento de temperatura, por ejemplo, cuando un ventilador del sistema falla y debe ser reemplazado. Aun así, un funcionamiento permanente a 45 grados centígrados puede costar a los discos duros algunos meses de vida útil. Al fin y al cabo, las especificaciones de tiempo medio hasta el fallo (MTTF) de las hojas de especificaciones de los fabricantes siempre se refieren a una temperatura de funcionamiento media de 40 grados centígrados.

Un punto interesante a este respecto: en realidad, media significa que los tiempos de funcionamiento a más de 40 grados centígrados pueden compensarse posteriormente con tiempos de funcionamiento a una temperatura correspondientemente más baja. En la práctica, sin embargo, es muy poco probable que los HDD operen los primero meses o años a temperaturas altas y luego el mismo tiempo a temperaturas más bajas.

La temperatura aumenta, la fiabilidad disminuye

Un disco duro empresarial típico tiene un MTTF de dos millones y medio de horas. En otras palabras, en el caso de dos millones y medio de unidades, se esperaría un fallo por hora, o en el caso de 1.000 unidades, un fallo cada 2.500 horas.

Dado que esta información no es especialmente intuitiva para estimar la probabilidad de fallo de los discos duros dentro de la propia infraestructura, se suele utilizar la tasa de fallo anual (AFR), que puede calcularse a partir del MTTF. La fórmula para esto es la siguiente: AFR = 1-e(-8,760/MTTF)*100, donde 8,760 son las horas de funcionamiento anuales para el funcionamiento 24/7, que es estándar para los discos duros empresariales.

En esta fórmula, las unidades que ya fallaron se consideran al calcular el AFR para las unidades restantes. Sin embargo, esto no es necesario para tasas de fallo bajas, como es el caso de los discos duros, lo que significa que la fórmula se puede simplificar: AFR = 8.760/MTTF*100. El AFR resultante para HDD empresariales con un MTTF de 2,5 millones de horas es, por tanto, del 0,35 por ciento. Cuando se utilizan 1.000 unidades, se puede esperar que tres o cuatro de ellas fallen cada año.

Si la temperatura media de funcionamiento de los discos duros supera los 40 grados centígrados, la tasa de fallos aumentara. Como regla general, por cada 5 grados por encima de los 40 grados centígrados, la tasa de fallo puede aumentar en un 30%. En el caso de una temperatura permanente de 55 grados centígrados, la AFR aproximadamente se duplicaría, por lo que una base instalada de 1000 unidades probablemente sufriría de seis a ocho fallos de disco duro por año.

La temperatura no es el único factor

Además de la temperatura, otros factores afectan la durabilidad de los discos duros, incluida la carga de trabajo anual (carga de trabajo nominal), el período de garantía y, en el caso de unidades no diseñadas para uso 24/7, el tiempo de funcionamiento. Esto no significa que exista un riesgo inmediato de fallo si no se respetan los valores especificados o si el disco duro continúa funcionando después de que haya expirado el período de garantía, pero con el tiempo, el AFR aumentaría, de modo que se observaría como fallan más de los números esperados de discos duros por año.

Un buen diseño térmico y una refrigeración correcta

En sistemas térmicamente bien diseñados y alojados en habitaciones con aire acondicionado, normalmente no debería haber problemas para mantener la temperatura del disco duro a 40 grados centígrados o menos. Sin aire acondicionado puede resultar difícil, dado que en los meses de verano la temperatura en las habitaciones suele superar los 30 grados centígrados. Esto supondría que en el interior de los servidores y sistemas de almacenamiento se alcanzarían rápidamente temperaturas superiores a los 40 grados centígrados. Además, el aire caliente de escape de los sistemas es difícil de eliminar sin una ventilación adecuada, lo que provoca un aumento inevitable de la temperatura ambiental y, en consecuencia, los sistemas se calientan aún más.

Por eso siempre es mejor operar servidores y sistemas de almacenamiento en un entorno con aire acondicionado, especialmente si se utilizan cargadores superiores con varias docenas de HDD. Por motivos de diseño, los discos duros traseros se calientan más que los delanteros, porque el flujo de aire absorbe primero el calor de los discos delanteros y, por lo tanto, ya no es capaz de enfriar los traseros con tanta eficacia. En este caso, se requieren temperaturas de entrada de aire inferiores a 20 grados centígrados para mantener los discos duros de las filas traseras por debajo de los 40 grados centígrados de forma permanente.

Si la temperatura del disco duro está permanentemente más de 15 grados centígrados por encima de la temperatura ambiental o de entrada de aire, supondría que existe algún problema con el diseño térmico del sistema. En este caso, los administradores deben comprobar si los ventiladores funcionan correctamente o si el flujo de aire llega sin obstáculos a los discos.

Además, la habitación en su conjunto debe diseñarse de manera que el aire frío y el caliente no se mezclen, ya que esto reduce la eficiencia de la refrigeración. Por este motivo, los bastidores suelen colocarse uno frente al otro y el aire de refrigeración se suministra en el medio, donde se encuentra con el frente de las unidades, y se aspira para enfriar los componentes del sistema. Durante este proceso, absorben el calor y luego se suelta nuevamente por la parte trasera de las unidades, donde es eliminado por los ventiladores. Asimismo, las cubiertas de las bandejas vacías evitan que el aire caliente de escape regrese al pasillo frío.

Resumen

Para garantizar que los discos duros funcionen correctamente y duren el mayor tiempo posible, los administradores deben monitorizar continuamente sus temperaturas de funcionamiento. Aunque los convertidores están diseñados para soportar temperaturas de hasta 60 grados centígrados, es fundamental evitar este valor máximo. Lo ideal es el funcionamiento a una temperatura media de no más de 40 grados centígrados. Garantizar que no se supere esta temperatura depende principalmente del diseño térmico del sistema y del concepto de refrigeración de la habitación en la que se encuentra el sistema.

Firmado: Rainer W. Kaese, director sénior de la división de Productos de Almacenamiento de Toshiba Electronics Europe GmbH

Lo más leído