northline-lab

ArticleСтатья

engineer@northline:~$ less articles/monitoring.md

Monitoring home and lab services without noiseМониторинг домашних и лабораторных сервисов без лишнего шума

The fastest way to ignore alerts is to create too many of them. On small systems, a compact monitoring stack is enough if it covers reachability, disk pressure, certificate expiry, and one or two service-specific signals.Самый быстрый способ начать игнорировать алерты - сделать их слишком много. На небольших системах компактного мониторинга вполне достаточно, если он покрывает доступность, давление на диск, срок действия сертификатов и один-два специфичных сигнала сервиса.

What I monitor firstЧто я мониторю в первую очередь

  • Host uptime and load anomalies.Uptime хоста и аномалии нагрузки.
  • Filesystem capacity and inode exhaustion.Заполнение файловой системы и исчерпание inode.
  • HTTP/TCP reachability for user-facing services.HTTP/TCP-доступность пользовательских сервисов.
  • Expiration windows for certificates and backups.Окна истечения сертификатов и актуальности бэкапов.

If an alert does not imply a plausible action, it probably belongs on a dashboard instead.Если алерт не подразумевает правдоподобного действия, ему, скорее всего, место на дашборде, а не в уведомлениях.

$ tail -n 3 updates.log

Service deployment checklistЧеклист выката сервиса DNS notes for small servicesDNS-заметки для небольших сервисов Log retention on quiet hostsХранение логов на спокойных хостах