Monitoring

Monitoring is het continu meten en bijhouden van de toestand van systemen, zodat je problemen signaleert voordat gebruikers er last van hebben. Het omvat het verzamelen van metrics, logs en tracing — samen ook wel observability genoemd.

De drie pijlers van observability

Pijler	Wat het meet	Voorbeeld
Metrics	Getallen over tijd	CPU-gebruik, requests per seconde
Logs	Gebeurtenissen met tijdstempel	Foutmeldingen in `/var/log`
Tracing	Pad van een request door het systeem	Hoe lang duurt elke stap?

Basismonitoring op Linux

# CPU, geheugen en processen
top
htop

# Schijfgebruik
df -h
iostat -x 1

# Netwerkverkeer
ss -s
iftop

# Systeemlogboek
journalctl -f

Veelgebruikte monitoring-tools

Prometheus — metrics verzamelen via pull-model
Grafana — dashboards en grafieken op basis van metrics
Alertmanager — meldingen sturen bij overschreden drempelwaarden
Zabbix / Nagios — traditionele all-in-one monitoring

Alerting

Een goed monitoringsysteem stuurt een alert wanneer een metric een drempelwaarde overschrijdt, zodat iemand kan ingrijpen. Denk aan: schijf meer dan 90% vol, service niet bereikbaar, of responsietijd te hoog.

Zie ook

syslog — logberichten op Linux
sla — beschikbaarheidsdoelen die je wilt bewaken
daemon — achtergrondprocessen die je monitort
high-availability — systemen ontwerpen voor hoge beschikbaarheid