Munin, Debian y errores como “hda: Invalid capacity for disk in drive, ide: failed opcode was: 0xe5″, etc

Creo que el título es bastante descriptivo, cuando lo “padeces” tienes una sensación cuanto menos “agobiante” (o acojono más bien, empiezas a pensar en el último backup y esas cosas;).

No hace mucho, en el servidor de un cliente de APACHEctl me encontré con estos errores en el syslog de un servidor web, con Debian Lenny para más señas y muchos días de uptime.

Aquí la lista al completo;

hda: Invalid capacity for disk in drive
hda: 0kB, 28884/0/129 CHS, 911 kBps, 65535 sector size, 768 rpm
hda: task_no_data_intr: status=0x41 { DriveReady Error }
hda: task_no_data_intr: error=0x04 { AbortedCommand }
ide: failed opcode was: 0xe5
hda: task_no_data_intr: status=0x41 { DriveReady Error }
hda: task_no_data_intr: error=0x04 { AbortedCommand }
ide: failed opcode was: 0x98

Después de darle unas cuantas vueltas al tema, me di cuenta de que había “causa-efecto” con una re-instalación de “Munin” (Un post de n1mh por cierto) reputada solución de monitorización de parámetros de un servidor web como; índice de carga, hilos de Apache, uso de MySQL, vmstat, correo, DNS, errores de red, etc. (Imágenes de Munin en acción).

Y es que “munin-cron” se ejecuta cada 5 min, justo el mismo tiempo que tardaba el syslog en “escupir” esos errores de disco. Creo que si no hubiese sido por esa “causa-efecto” de la re-instalación, el tema me hubiese dado más de un dolor de cabeza haciendo comprobaciones de disco. Comprobaciones que por cierto no devengaban ningún error…

Al final la solución llegó bajándome la última versión estable de Munin (1.4.5) del sitio web de Munin y compilando. Los errores desaparecieron y a pesar de que hablando de Debian y servidores, me gusta siempre “estar con las versiones de Debian”, hay que ir a lo práctico y seguro. Por cierto, ya está disponible la beta 2 de Munin con interesantes novedades.

Espero que si llegas desde Google buscando sobre el tema el apunte te sea tan útil como me lo hubiese sido a mi en el caso de haber encontrado algún hilo conductor entre esos errores y el uso de Munin (en este caso el problema llegó con (Munin 1.2.6-10~lenny2). Lo “curioso” es que en otros servers con esa misma versión, no da ese tipo de fallos aunque no hablamos del mismo hard, tipo de sistemas de ficheros o tablas de particiones. Saludos !