Monitoring

Monitoring is het continu meten en bijhouden van de toestand van systemen, zodat je problemen signaleert voordat gebruikers er last van hebben. Het omvat het verzamelen van metrics, logs en tracing — samen ook wel observability genoemd.

De drie pijlers van observability

PijlerWat het meetVoorbeeld
MetricsGetallen over tijdCPU-gebruik, requests per seconde
LogsGebeurtenissen met tijdstempelFoutmeldingen in /var/log
TracingPad van een request door het systeemHoe lang duurt elke stap?

Basismonitoring op Linux

# CPU, geheugen en processen
top
htop

# Schijfgebruik
df -h
iostat -x 1

# Netwerkverkeer
ss -s
iftop

# Systeemlogboek
journalctl -f

Veelgebruikte monitoring-tools

  • Prometheus — metrics verzamelen via pull-model
  • Grafana — dashboards en grafieken op basis van metrics
  • Alertmanager — meldingen sturen bij overschreden drempelwaarden
  • Zabbix / Nagios — traditionele all-in-one monitoring

Alerting

Een goed monitoringsysteem stuurt een alert wanneer een metric een drempelwaarde overschrijdt, zodat iemand kan ingrijpen. Denk aan: schijf meer dan 90% vol, service niet bereikbaar, of responsietijd te hoog.

Zie ook

  • syslog — logberichten op Linux
  • sla — beschikbaarheidsdoelen die je wilt bewaken
  • daemon — achtergrondprocessen die je monitort
  • high-availability — systemen ontwerpen voor hoge beschikbaarheid
linuxbeheerobservability