
Backblaze, una empresa de copias de seguridad y almacenamiento en la nube, ha estado rastreando las tasas de fallos anualizadas (AFR) de los discos duros (HDD) en su centro de datos desde 2013. Esta recopilación de datos ha llevado a la empresa a concluir que los HDD “están durando más” y mostrando menos errores.
Esta conclusión se desprende de una publicación en el blog de Backblaze, escrita por Stephanie Doyle, especialista en operaciones de blog, y Pat Patterson, evangelista técnico jefe. Los autores compararon las AFR de aproximadamente 317.230 unidades en el centro de datos de Backblaze con las AFR registradas por la empresa al examinar 21.195 unidades en 2013 y 206.928 unidades en 2021. Doyle y Patterson identificaron “una desviación bastante sólida tanto en la edad del fallo de la unidad como en el punto álgido de la AFR con respecto a las dos últimas veces que hemos realizado los análisis”.
Según Doyle y Patterson, los picos de porcentaje de fallos de las unidades probadas este año fueron del 4,25 por ciento a los 10 años y tres meses, en comparación con el 13,73 por ciento a los tres años y tres meses en 2013 y el 14,24 por ciento a los siete años y nueve meses en 2021.

“No sólo es una mejora significativa en la longevidad de la unidad, sino que también es la primera vez que vemos la tasa máxima de fallos de la unidad en el extremo más lejano de la curva de la unidad. Y es aproximadamente un tercio de cada uno de los otros picos de fallos”, escribieron Doyle y Patterson.
Para obtener más información sobre las unidades analizadas este año, se puede consultar la publicación de agosto de Patterson y Doyle en el blog. Las unidades eran de HGST, Seagate, Toshiba y WDC, y tenían una edad media de 3,7 meses a 103,9 meses (unos 8,7 años). Las unidades oscilaban entre 4 TB y 24 TB. En 2021, la muestra de Backblaze contenía unidades de los mismos proveedores, y las unidades probadas para cada modelo tenían una edad media de 3,57 a 80,85 meses (unos 6,7 años). Las unidades oscilaban entre 4 TB y 16 TB.
Como Backblaze ha hecho en el pasado, Doyle y Patterson compararon los comportamientos de los HDD del centro de datos de Backblaze con la curva de la bañera, un principio de ingeniería que dice que las tasas de fallos de los componentes tienden a seguir una forma de U con el tiempo, con más fallos que ocurren al principio de la vida antes de que la tasa caiga, se asiente y luego se recupere a medida que el componente envejece.
Sin embargo, como se ve en el gráfico de Backblaze, los HDD de la empresa no se adhieren a ese principio. Los autores del blog señalaron que en 2021 y 2025, las unidades de Backblaze tenían una “tasa de fallos bastante uniforme durante la gran mayoría de la vida útil de las unidades, y luego un pico bastante pronunciado una vez que entramos en el territorio de los fallos de la unidad”.
Implicaciones y Perspectivas
El blog continúa:
“¿Qué significa eso? Bueno, las unidades están mejorando y durando más. Y, dado que nuestras líneas de tendencia tienen aproximadamente la misma forma de 2021 a 2025, probablemente deberíamos volver a comprobarlo cuando llegue 2029 para ver si nuestro pico de fallos se ha desplazado aún más”.
En declaraciones a Ars Technica, Doyle dijo que el análisis de Backblaze es una buena noticia para las personas que compran discos duros más grandes porque los dispositivos “van a durar más”.
Añadió:
“En muchos sentidos, se puede pensar en el uso de discos duros por parte de un centro de datos como la prueba definitiva para un disco duro: se mantiene un disco duro encendido y girando durante la máxima cantidad de horas, y a menudo la cantidad de veces que se leen/escriben archivos es muy superior a lo que se vería como consumidor. En cuanto a la tendencia de la industria, las unidades son cada vez más grandes, lo que significa que a menudo la gente compra menos de ellas. Informar sobre cómo se comportan estas unidades en un entorno de centro de datos puede darte más confianza en que cualquier unidad que compres es una buena inversión”.
La longevidad de los HDD es también otra razón para que los compradores sigan considerando los HDD en lugar de los SSD, más rápidos y caros.
“Es una buena idea decidir cuán justificada está la mejora en la latencia”, dijo Doyle.
Cuestionando la curva de la bañera
Doyle y Patterson no pretenden tirar la curva de la bañera por la borda. No sugieren que la curva de la bañera no se aplique a los HDD, sino que pasa por alto factores adicionales que afectan a las tasas de fallos de los HDD, incluyendo “la carga de trabajo, la variación de la fabricación, las actualizaciones de firmware y la rotación operativa”. El principio también asume que, según los autores:
- Los dispositivos son idénticos y operan bajo las mismas condiciones
- Los fallos ocurren independientemente, impulsados principalmente por el tiempo
- El entorno permanece constante a lo largo de la vida de un producto
Si bien estas condiciones pueden cumplirse en gran medida en entornos de centros de datos, “las condiciones nunca pueden ser perfectas”, señalaron Doyle y Patterson. Al considerar las tasas de fallos de un HDD a lo largo del tiempo, es aconsejable tener en cuenta tanto la curva de
Fuente original: ver aquí
