Havarie-Plan
Contents
Werkzeugkasten[edit]
1. Systemzustand & Ressourcen (CPU, RAM, Load)[edit]
Grundlegend[edit]
top / htop – laufende Prozesse, CPU/RAM
atop – sehr detailliert (CPU, RAM, I/O, Netzwerk)
uptime – Load Average
free -h – Speicherübersicht
vmstat 1 – CPU, I/O, Speicher
Tiefergehend[edit]
pidstat – Prozessbezogene Statistiken
mpstat – CPU-Auslastung pro Core
numactl, numastat – NUMA-Analyse
2. Storage & I/O[edit]
Übersicht[edit]
df -hT – Dateisysteme & Typen
du -sh * – Speicherverbrauch
lsblk -f – Blockgeräte
mount, findmnt
I/O-Analyse[edit]
iostat -xz 1 – Latenz, I/O-Wait
iotop – Disk-Last pro Prozess
blktrace, blkparse – Low-Level
lsusb
Dateisysteme[edit]
fsck
tune2fs, dumpe2fs
xfs_repair, xfs_growfs
3. Netzwerk[edit]
Basis[edit]
ip a, ip r, ip n
ss -tulpn (Kernel)
netstat -tulpn (/proc/..)
ping, tracepath, traceroute
arp, ip neigh
Traffic & Debugging[edit]
tcpdump
termshark
iftop
nload
ethtool
Erweiterte Tools[edit]
conntrack
tc
mtr
4. Logs & Events[edit]
Standard[edit]
journalctl -xe
journalctl -u <service>
dmesg -T
/var/log/syslog, /var/log/messages
Analyse[edit]
grep, egrep, rg
awk, sed
less +F
Audit & Logrotation[edit]
logrotate -d
ausearch, auditctl
5. Prozesse & Services[edit]
systemd[edit]
systemctl status
systemctl list-units --failed
systemctl show
systemd-analyze blame
systemd-analyze critical-chain
Debugging[edit]
strace -p <PID>
lsof
pstree -ap
coredumpctl
6. Hardware & Kernel[edit]
lscpu, lsmem
lsusb, lspci
dmidecode
uname -a
lsmod, modprobe
sysctl -a
7. Sicherheit[edit]
last, lastlog, who
faillog
getenforce, sestatus
iptables -L -nv
nft list ruleset
8. Performance & Spezialtools[edit]
perf
bpftrace
sysdig
dstat
sar
9. Container & Virtualisierung[edit]
Docker[edit]
docker stats
docker inspect
docker logs
Kubernetes[edit]
kubectl describe
kubectl logs
kubectl top
Virtualisierung[edit]
virsh
virt-top
Typische Probleme[edit]
zuviele Zugriffe[edit]
var/run/openvpn .status auf undef prüfen, ob es zuviele sind cat *.status | grep UNDEF | wc -l (zählt die undef) wenn ja, kann in der Einstellung die Anmeldungen pro Zeiteinheit herunter gesetzt werden var/lcportal/persistent/dc/openvpn/server-tun0.conf connect-freq 10 2 ( 10 Anmeldungen pro 2 sek)
Systemauslastung[edit]
top, htop, atop