domingo, 10 de agosto de 2014

Filesystem / full en AIX

Me ocurría en la oficina que varios de los servidores AIX, destinados a bases de datos, se les comenzaba a llenar el filesystem / y tengo un script que una vez llega al umbral del 90% de ocupación comienza a mandar una alerta y ésta ya se estaba empezando a volver molesta.

Inicialmente comencé a borrar unos archivos que encontraba en la siguiente ruta

#cd /etc/perf/daily

Los archivos que allí se encuentra tienen la siguiente estructura:

nombrehost _conscutivo.topas

En estos archivos se suele guardar o recopilar la data de rendimiento de la máquina el cual puede ser leído mediante el comando

#topasout -a nombrearchivo.topas

Este borrado me funcionaba ya que el porcentaje de ocupación del / quedaba en 86%.

Hace poco se volvió a llenar el filesystem y aunque borre todos los archivos .topas que habían en el directorio éste no bajo su porcentaje de ocupación (93%). 

Buscando un poco en internet me dí cuenta que es un bug del common agent services (CAS) de aix y que se resuelve (logueado como root) de la siguiente manera:

Trabajemos con este ejemplo de este servidor que se encuentra al 87%




Vamos al directorio /dev
> cd /dev
> ls -lrt null*



Esto es realmente lo que llena nuestro filesystem (null 2>&1)

Detenemos el servicio cas:
>stopsrc –s cas_agent

Y luego editamos el script que lanza dicho servicio:
>vi /var/opt/tivoli/ep/runtime/nonstop/bin/cas_src.sh

Buscamos las líneas donde aparece:

else 
    CAS_SRC_LOG=”/dev/null 2>&1” 
fi




Y la cambiamos por esta:

else 
    CAS_SRC_LOG=”/dev/null” 
fi



Guardamos el archivo y procedemos a borrar el causante de nuestra dolencia.

>rm "/dev/null 2>&1"


Iniciamos nuevamente el servicio:
>startsrc –s cas_agent

Y validamos el resultado:
>df -g

Y del 87% de ocupación bajamos al 17%; para este ejemplo una ganancia del 70%.  Ahora cuando se llene tocará ver qué otra cosa es, porque el bug ya lo aplastamos.

Fuente del artículo