En un momento en el que la conversación tecnológica suele girar alrededor de la Inteligencia Artificial y los chips, Backblaze ha vuelto a hacer algo mucho menos vistoso, pero tremendamente útil para cualquier equipo de operaciones: publicar datos. Su informe anual Drive Stats 2025 cumple 13 años de seguimiento continuo del comportamiento de discos duros en producción, una serie que, con el tiempo, se ha convertido en un termómetro poco habitual para entender qué pasa de verdad cuando cientos de miles de unidades giran día y noche en centros de datos.
El titular de este año es claro: la tasa de fallos anualizada (AFR) de 2025 baja al 1,36 %, por debajo del 1,55 % de 2024. En el último trimestre (Q4 2025), el dato mejora aún más hasta el 1,13 %, mientras que la visión “de por vida” se mantiene prácticamente estable en el 1,30 %. Dicho en lenguaje de pasillo: el parque de discos parece más sano, pero el trabajo de mantenimiento no desaparece; solo cambia de forma.
Una muestra que impresiona: cientos de miles de discos bajo vigilancia
Backblaze explica que, al cierre de 2025, estaba monitorizando 349.462 unidades de almacenamiento para sus sistemas. Para el análisis anual, excluye discos de arranque y otros que no cumplen sus criterios estadísticos, quedándose con 344.196 discos válidos repartidos en 30 modelos. El informe no se limita a “contar fallos”: también contextualiza por edad, volumen de “días de disco” y cambios operativos, para evitar conclusiones engañosas cuando el tamaño de la muestra es pequeño o el hardware está al final de su vida útil.
Ese enfoque es clave para leer bien los números: en entornos reales, el “cómo” pesa tanto como el “cuánto”. Un pico de fallos puede ser un defecto de firmware, sí, pero también una vibración persistente, un bastidor con comportamiento anómalo, una tanda concreta, o simplemente el desgaste esperable tras años de servicio.
Qué significa AFR y por qué Backblaze pone “límites” a su propio dataset
La AFR (Annualized Failure Rate) es una forma de anualizar fallos para compararlos en el tiempo, incluso cuando se analiza un trimestre. Backblaze, además, fija umbrales mínimos para incluir modelos en tablas y gráficos: por ejemplo, en análisis trimestral exige más de 100 unidades y más de 10.000 “drive days”; en anual, más de 250 unidades y más de 50.000 “drive days”; y en la tabla de “por vida”, más de 500 unidades y más de 100.000 “drive days”. El objetivo es sencillo: evitar que unas pocas averías en un grupo pequeño deformen el retrato general.
Para quien compra o opera almacenamiento, la lección práctica es evidente: las comparativas de fiabilidad solo sirven si el tamaño de muestra y el tiempo en producción son suficientes. Y, aun así, conviene mirar la tendencia, no solo el dato puntual.
Más capacidad en menos discos: la flota se desplaza hacia tamaños grandes
Una de las fotografías más interesantes del informe es la distribución de capacidad. Backblaze observa que el peso del almacenamiento se desplaza hacia discos grandes: en su desglose, los discos de 0–12 TB representan 25,13 %, los de 14–16 TB suben a 52,06 %, y los de 20 TB o más ya son 22,81 %. Es una confirmación de una tendencia que se ve en muchos centros de datos: reducir el número de unidades necesarias para almacenar lo mismo (y, por tanto, reducir puntos potenciales de fallo y trabajo de sustitución), aunque eso obligue a hilar más fino en planificación de capacidad, reconstrucciones y políticas de resiliencia.
En ese contexto, el informe destaca también la llegada de unidades nuevas a la flota, incluida la introducción de un modelo de 26 TB de Western Digital (su “primer disco de 26 TB” en producción), un indicio de que la carrera por densidad sigue acelerándose.
El “cuadro de honor” y las alertas: cuando el problema no es el disco, sino el entorno
Backblaze acompaña sus tablas con una lista muy humana: modelos que “se portan” y modelos que disparan alarmas. En Q4 2025, tres casos sobresalen por su AFR trimestral elevada:
- HGST HUH728080ALE600 (8 TB): 10,29 %
- Seagate ST10000NM0086 (10 TB): 5,23 %
- Toshiba MG08ACA16TEY (16 TB): 4,14 %
En el caso del HGST de 8 TB, la compañía añade un matiz que rompe el cliché de “modelo malo”: el grupo analizado era de 1.073 discos, menos de lo que sería un “Vault” estándar de 1.200 discos, lo que sugiere concentración física. Su investigación interna descartó temperatura como causa principal y apuntó a sensibilidad a vibración; aun así, el factor edad pesa (alrededor de 7,5 años), y la decisión operativa fue marcar estas unidades para un proceso normal de migración y retirada.
El caso de Toshiba MG08ACA16TEY también es revelador por otro motivo: ilustra el impacto de firmware y mitigaciones. Tras registrar un trimestre anterior con AFR extraordinariamente alta, Backblaze menciona trabajo colaborativo de firmware y una “normalización” progresiva. La cifra sigue por encima de lo ideal, pero la trayectoria sugiere que el problema no siempre está en el “hierro” como tal, sino en cómo se gestiona su madurez en producción.
La realidad operativa: sustituir discos sigue siendo un trabajo diario
Aunque el AFR mejore, la logística no se detiene. Solo en Q4 2025 fallaron 943 discos, una cadencia que, traducida a la trinchera, equivale a decenas de sustituciones diarias en una flota grande. Es el lado menos glamuroso del almacenamiento masivo: el mantenimiento no es un “evento”, es una rutina industrial.
Por eso, Drive Stats suele interesar especialmente a equipos de sistemas: no tanto para elegir “el disco perfecto”, sino para afinar políticas de ciclo de vida, repuestos, migraciones preventivas, control de vibración, y el tipo de observabilidad (SMART, alertas, tickets) que evita que un problema local se convierta en una estadística global.
Preguntas frecuentes
¿Qué es la tasa de fallos anualizada (AFR) y cómo se interpreta en centros de datos?
La AFR estima qué porcentaje de discos fallaría en un año si se mantuviera el ritmo observado en un periodo. Es útil para comparar trimestres y años, pero debe leerse junto a “drive days”, tamaño de muestra y edad de los discos.
¿Qué significa que Backblaze haya bajado al 1,36 % de AFR en 2025?
Que, en su flota analizada, la fiabilidad global mejora respecto a 2024. No implica que “casi no fallen discos”, sino que, proporcionalmente, la tasa de reemplazos baja… aunque en números absolutos siga habiendo sustituciones constantes.
¿Qué modelos dieron señales de alerta en Q4 2025 según Backblaze Drive Stats?
Entre los más llamativos por tasa trimestral elevada aparecen HGST HUH728080ALE600 (8 TB), Seagate ST10000NM0086 (10 TB) y Toshiba MG08ACA16TEY (16 TB). Backblaze añade contexto operativo (edad, entorno, firmware) antes de sacar conclusiones.
¿Sirven estos datos para elegir discos para NAS o servidores en empresa?
Sirven como referencia, pero con cautela: los resultados dependen del entorno, del uso, de la edad y del tamaño de muestra. Lo más valioso suele ser la tendencia y la gestión del ciclo de vida, más que buscar un “ganador” absoluto.
vía: backblaze