Exprimir la vida de un servidor es una de las prioridades de los clientes, recientemente me propusieron reutilizar un antiguo servidor HP Proliant ML350 G6
Tenia capacidad suficiente para albergar un par de maquinas virtuales en un entorno no muy exigente, Decidimos ampliarle la memoria R.A.M y utilizar un RAID con discos duros nuevos. Tras una pequeña investigación de mercado escogimos las unidades HGST HTS721010A9E630.
Durante los primeros días todo funciono perfectamente, hasta que recibí una llamada de la oficina del cliente comentándome que el ruido procedente de la sala de servidores era ensordecedor. Al llegar a la oficina comprobamos que el servidor tenia los ventiladores a máxima velocidad.
Para intentar repara el problema realizamos varias comprobaciones:
- Actualizar el kernel de Linux.
- Instalar las utilidades de HP para Linux.
- Comprobamos la configuración de la BIOS.
- Comprobar si existía algún ventilador estropeado
- Actualizamos BIOS y demás firmwares
Nada de esto resolvió el problema. Pero entonces vimos una luz roja en el panel frontal y decidimos consulta a el estado del servidor en la ILO2, allí existía una alarma de sobretemperatura en las unidades de disco duro.
Apagamos el servidor y comprobamos los discos duros, estaban fríos y no a 65º como indicaba la ILO. Después de navegar un poquito por Internet descubrimos que el problema esta relacionado con la lectura de temperatura que se produce por S.M.A.R.T.
http://dascomputerconsultants.com/HPCompaqServerDrives.htm
Solución: Cambiar los discos duros por unos de la lista que no dan problemas