От много време се каня и днес най-накрая реших да си седна на ГЗ и да сложа някаква програма за мониторинг на служебните компютри. С времето се събраха доста машини, на който върви по някоя програма, за която е важно да не спира или ако това се случи веднага да разбера, например, програми за следене на различни производствени процеси, такива, които следят и определят кога и как да работи дадена машина, машини за видео наблюдение и други.
Разбира се започнах от LinuxQuestions и тяхната годишна анкета 2008 LinuxQuestions.org Members Choice Awards. В раздела Monitoring Application of the Year на 1-во място беше Nagios. Попрочетох някои неща и реших, че ще ми свърши работа. С уеб интерфейс и всичко на едно място, с възможност сам да си дописваш модули и да добавяш плъгини. След цял ден четене, инсталиране и настройка, мога да кажа, че съм доволен. Имам отлично работеща програма за мониторинг на машините. В момента следи 2 linux машини и още 9 на Windows. За гъвкавостта на Nagios - МОЖЕ АБСОЛЮТНО ВСИЧКО. Аз се спрях на следното - на всички машини следя някои основни показатели като натоварване на процесора, свободно място на отделните дялове на дисковете, натоварване на паметта, uptime. На всяка поотделно съм сложил да следи и за процесите и services, които са важни за съответния компютър - бази данни, WEB сървъри, лицензни сървъри, squid, VPN сървър, мониторингови програми и т.н. В крайна сметка списъка ми съдържа 11 хоста и 91 услуги.
Параметрите който се следят могат да бъдат в определени от потребителя граници. Например за свободното място на диска - статус OK ако е заето под 80%; Warning - когато мине над 80% и Critical - когато прескочи 90%. Когато следя пинг до отдалечена машина например мога да задам в какви граници е допустимия лаг и процент на загубените пакети. Задава се и интервал на проверките, както и възможност за известяване по имейл при определени критерии (брой Warning или Critical резултат след проба на някоя от следените услуги).
На всяка машина, която искам да се наблюдава се инсталира програма, която прави това възможно. Конфигурационните файлове са доста. Документацията също не е малка, но е леко неподредена с безброй препратки от една страница към друга. Като към това добавим и меко казано постните логове, откриването на грешка става доста трудно, не не е невъзможно.
Планувал съм да добавя още няколко дреболии, които съвсем да ми облекчат живота. Ако ми се сторят достатъчно важни, за да ги добавя тук ще пиша пак.
Няма коментари:
Публикуване на коментар