Aprende qué es un test SMART y cuándo hacerlo en un servidor NAS

Tests S.M.A.R.T de los discos en mi servidor NAS cuándo debo hacerlo

Actualmente los servidores NAS cuentan con la posibilidad de instalar discos duros para el almacenamiento de la información, y también unidades SSD (ya sea en formato 2,5» con interfaz SATA3 e incluso en formato M.2 con interfaz SATA3 o NVMe). Saber en todo momento el estado de los discos es algo fundamental, y no solamente la temperatura actual de los mismos. Realizar tests SMART con una cierta periodicidad es crítico para detectar posibles errores en el disco antes de que sea demasiado tarde. Hoy en RedesZone hablaremos sobre cómo realizar un tests SMART en un servidor, y también cuándo deberíamos hacerlos.

Los discos duros y unidades SSD constituyen una parte esencial de un servidor NAS. En los HDD almacenaremos la información, normalmente redundada haciendo uso de diferentes niveles de RAID como RAID 1, RAID 5 que es uno de los más utilizados, y también RAID 6 e incluso RAID 10. Además, también usaremos los SSD como caché SSD para acelerar enormemente la lectura y escritura aleatoria de datos, tanto desde la red al NAS (caché de escritura), como desde el NAS a los equipos conectados (caché de lectura), por supuesto, estos SSD también estarán configurados con diferentes niveles de RAID para proteger la integridad de la información en caso de fallo físico de uno o varios SSD. No obstante, también se podrían configurar conjuntos de almacenamiento con discos SSD únicamente, con el objetivo de guardar aquí información a la que accedamos casi de manera continua. Por ejemplo, si haces uso de máquinas virtuales en tu servidor NAS, es muy buena opción crear un conjunto de almacenamiento de SSD para ello, ya que aceleraremos la carga del sistema operativo enormemente.

Con el paso del tiempo, tanto los discos duros mecánicos como los SSD, son propensos a averiarse, si no estamos atentos, podemos llevarnos un susto y perder uno o varios de los discos en un corto periodo de tiempo. Por este motivo, existen los tests SMART que nos permitirán obtener una información muy valiosa sobre el estado de los discos, y podremos sustituirlos antes de que se puedan averiar.

Esto no es exclusivo de los servidores NAS, también un PC o portátil puede aprovecharse de ello. Cualquier equipo que incorpore un HDD o un SSD, podremos realizar un test SMART para comprobar la salud del disco, si hay algún sector dañado en el que no podemos escribir, o si hay algún otro tipo de problema, con el objetivo de anticiparse a un fallo de hardware del propio disco.

Qué es S.M.A.R.T y por qué es tan importante

La tecnología S.M.A.R.T viene de  las siglas en inglés de Self Monitoring Analysis and Reporting Technologyo traducido «Tecnología de informes y análisis de autosupervisión». La finalidad de la tecnología SMART es comprobar los discos duros y SSD para detectar posibles fallos en los mismos de manera anticipada, con el objetivo de anticiparnos a un posible fallo de hardware, y sustituir el disco antes de tener una pérdida de datos irrecuperable.

hardwipe borrado seguro disco duro

Una detección anticipada de los fallos en un disco, puede permitir al usuario hacer una copia de seguridad de su contenido, o reemplazar el disco por otro si tenemos un servidor NAS con un nivel de RAID que permita esto sin tener pérdida de datos. Así evitamos que se produzca una pérdida de datos irrecuperable. Debemos recordar que un RAID no es una copia de seguridad, las copias de seguridad deben realizar siguiendo el sistema 3-2-1, realizar 3 copias de seguridad, en 2 soportes diferentes, y que 1 copia esté offline.

Si queremos usar esta tecnología S.M.A.R.T se tienen que cumplir dos requisitos:

  1. Que la BIOS/UEFI del equipo esté activada esa opción.
  2. Que el sistema operativo soporte esta funcionalidad (actualmente todos los SO lo soportan).
  3. El propio disco duro o SSD sea compatible con ella.

Actualmente, por defecto viene habilitada esa opción en los equipos, y los discos duros como norma general también la soportan. Entre los parámetros más importantes que controla tenemos:

  • Temperatura del disco.
  • Velocidad de lectura de datos.
  • Contador de sectores reasignados: son los que han fallado, y según el número, puede ser un síntoma de la que unidad se puede estropear en cualquier momento.
  • Uso de código de corrección de errores (ECC) y conteo de errores.

En cuanto a los valores de los atributos SMART son del número 1 al 253, en el que 1 sería el peor valor. En este sentido los valores normales son entre 100 y 200. Por lo tanto, realizando tests S.M.A.R.T a nuestros discos duros y SSD podemos obtener mucha información sobre la salud de los mismos.

Cómo ver el estado de salud de un disco en Windows

Antes de meternos de lleno en cómo ver el estado SMART en un servidor NAS de QNAP, os vamos a enseñar cómo ver la salud de los discos con el sistema operativo Windows, esto también lo puedes comprobar si utilizas un Windows Server. Nos aporta una importante información y gracias a ella podremos tomar las medidas oportunas:

  1. No hacer nada si el estado bueno.
  2. Hacer una copia de seguridad y sustituir el HDD si el estado es malo.

Para realizar esta tarea, necesitamos de un software que nos muestre la información sobre el estado de nuestros discos. En este caso, vamos a empezar utilizando Crystal Disk Info que podéis descargar desde aquí. Nosotros hemos optado por la edición estándar en ZIP que no requiere instalación. Si tenemos un disco duro en buen estado nos mostrará esta información:

Eso quiere decir que este HDD en concreto está bien, y que no requiere de ninguna atención especial. El estado de salud es bueno y está en color azul. Sin embargo, cuando aparecen estos resultados empiezan los problemas:

Cuando se pone estado «en riesgo» ya debemos empezar a preocuparnos, es momento de ir pensando en realizar una copia de seguridad de todos los datos y proceder a cambiar el HDD. Cuando está en color rojo, la situación suele ser crítica, y es posible que no puedas evitar la pérdida de datos.

Cómo realizar un test SMART en mi servidor NAS

En nuestro laboratorio de pruebas tenemos un servidor NAS QNAP TS-1277, el cual tiene un total de 8 bahías para discos de 3,5», 4 bahías para discos o SSD de 2,5», y dos ranuras M.2 SATA3. Para ver el estado de los discos, debemos irnos a «Almacenamiento e instantáneas«, y en el lateral izquierdo nos iremos a «Almacenamiento / Discos/VJBOD«. Una vez aquí, seleccionaremos el disco y pinchamos sobre «Condición del disco«, nos aparecerá lo siguiente:

En la «Condición del disco» podremos ver el modelo de disco duro o SSD, la capacidad, la temperatura, el tiempo de encendido y otra información. La información importante está en la sección «Información SMART», donde podremos ver todos y cada uno de los parámetros que es capaz de medir esta función tan importante. QNAP nos permite realizar una prueba rápida o una prueba completa en todo momento, simplemente debemos irnos a la sección de «Prueba» y seleccionar una de las dos opciones.

Lo más interesante está en la sección de «Configuración», y es que aquí es donde podremos configurar el aviso de temperatura alta, y también podremos programar los tests de SMART rápidos y completos cuando nosotros deseemos. Esto es fundamental para realizar un test de SMART de manera proactiva, para anticiparnos a posibles fallos de un disco duro o SSD.

En el caso de los SSD también tendremos información de SMART, además, podremos ver una estimación del tiempo de vida del SSD, y por supuesto podremos ver la temperatura, los parámetros avanzados de SMART, realizar un test rápido y completo bajo demanda, e incluso programar los tests SMART para que se realicen automáticamente.

En la sección de «Configuración global» podremos disponer de otras opciones muy interesantes relacionadas con SMART. La primera de ellas es que podremos activar una migración predictiva de SMART para migrar todos los datos antes de que uno de los discos falle, y podamos tener pérdida de datos, esto se puede hacer tanto en los discos duros como en los SSD. Gracias a esta funcionalidad, el sistema operativo se anticipará automáticamente ante un posible fallo del disco antes que suceda.

Otra opción es el tiempo de sondeo de SMART, para consultar cada un cierto tiempo al disco en busca de errores SMART. Un aspecto importante es que una comprobación demasiado frecuencia podría degradar el rendimiento de los discos levemente, por tanto, sería recomendable hacerlo cada hora ya que es lo máximo que permite QNAP.

Si estamos utilizando un sistema operativo como XigmaNAS que está orientado específicamente a servidores NAS, también tendremos gran cantidad de información de SMART para visualizar y tomar una decisión. Si pinchamos en «Diagnóstico / Información / SMART» podremos ver el estado actual de SMART de todos los discos que tengamos, además, con cada atributo nos marcará un determinado valor, y también una descripción de qué significa cada uno de estos atributos.

En la parte inferior podemos ver el registro de los diferentes tests de SMART realizados, tanto cortos (rápidos) como extendidos (completos), en la siguiente captura se puede ver cómo hay un error de lectura, el bloque lógico afectado (LBA), y también el tiempo de vida del disco duro.

Si miramos el estado de otro de los discos, se puede ver cómo este mismo tests se ha completo sin errores, que el tiempo de uso es claramente inferior, y que no tenemos ningún error LBA. Es decir, el disco anterior está un poco «tocado» y sería recomendable sustituirlo cuanto antes, sin embargo, este disco sin errores está perfectamente.

Por supuesto, el SMART del sistema operativo XigmaNAS también se puede configurar para realizar estos tests bajo demanda o programados cuando nosotros queramos.

Cada cuánto tiempo debería realizar un test SMART

Es muy importante programar el sistema operativo del servidor NAS para realizar tests SMART rápidos periódicamente, y también programar tests SMART completos a los diferentes discos que nosotros tengamos en el servidor. A la hora de realizar tests S.M.A.R.T en un NAS debemos tomar una serie de consideraciones:

  1. Es recomendable no estar realizando copias de seguridad en ese momento.
  2. Intentar dejar el servidor con poca carga de trabajo o ninguna.

Un test SMART rápido puede tardar menos de 2 minutos en realizarse, durante este tiempo, el rendimiento en lectura y escritura de los discos donde lo estemos realizando se puede ver afectado. En el caso de los tests SMART completos, pueden tardar horas en realizarse, por tanto, es recomendable hacer esta tarea de madrugada donde normalmente no habrá demasiada actividad, aunque recuerda no realizar backups en ese preciso instante porque el rendimiento será menor.

Dependiendo del uso del servidor NAS, y si está siempre encendido o no, será recomendable programar los tests SMART más separados en el tiempo o más habitualmente. Por ejemplo, un test SMART rápido una vez a la semana podría ser un buen comienzo, ya que detectaremos los principales fallos que pudiera haber en el disco. Un test SMART completo se debería realizar una vez mensualmente, a poder ser, de madrugada o en fin de semana cuando no hay nadie trabajando con el NAS. Debido a que lo podemos programar para su realización automática, no tendremos que estar presentes mientras se realiza, pero sí estar atentos cuando finaliza por si hay algún tipo de error.

El artículo Aprende qué es un test SMART y cuándo hacerlo en un servidor NAS se publicó en RedesZone.

Powered by WPeMatico

Gustavo Genez

Informático de corazón y apasionado por la tecnología. La misión de este blog es llegar a los usuarios y profesionales con información y trucos acerca de la Seguridad Informática.