Werkzeugkasten[edit]

1. Systemzustand & Ressourcen (CPU, RAM, Load)[edit]

Grundlegend[edit]

top / htop – laufende Prozesse, CPU/RAM

atop – sehr detailliert (CPU, RAM, I/O, Netzwerk)

uptime – Load Average

free -h – Speicherübersicht

vmstat 1 – CPU, I/O, Speicher

Tiefergehend[edit]

pidstat – Prozessbezogene Statistiken

mpstat – CPU-Auslastung pro Core

numactl, numastat – NUMA-Analyse

2. Storage & I/O[edit]

Übersicht[edit]

df -hT – Dateisysteme & Typen

du -sh * – Speicherverbrauch

lsblk -f – Blockgeräte

mount, findmnt

I/O-Analyse[edit]

iostat -xz 1 – Latenz, I/O-Wait

iotop – Disk-Last pro Prozess

blktrace, blkparse – Low-Level

lsusb

Dateisysteme[edit]

fsck

tune2fs, dumpe2fs

xfs_repair, xfs_growfs

3. Netzwerk[edit]

Basis[edit]

ip a, ip r, ip n

ss -tulpn (Kernel)

netstat -tulpn (/proc/..)

ping, tracepath, traceroute

arp, ip neigh

Traffic & Debugging[edit]

tcpdump

termshark

iftop

nload

ethtool

Erweiterte Tools[edit]

conntrack

tc

mtr

4. Logs & Events[edit]

Standard[edit]

journalctl -xe

journalctl -u <service>

dmesg -T

/var/log/syslog, /var/log/messages

Analyse[edit]

grep, egrep, rg

awk, sed

less +F

Audit & Logrotation[edit]

logrotate -d

ausearch, auditctl

5. Prozesse & Services[edit]

systemd[edit]

systemctl status

systemctl list-units --failed

systemctl show

systemd-analyze blame

systemd-analyze critical-chain

Debugging[edit]

strace -p <PID>

lsof

pstree -ap

coredumpctl

6. Hardware & Kernel[edit]

lscpu, lsmem

lsusb, lspci

dmidecode

uname -a

lsmod, modprobe

sysctl -a

7. Sicherheit[edit]

last, lastlog, who

faillog

getenforce, sestatus

iptables -L -nv

nft list ruleset

8. Performance & Spezialtools[edit]

perf

bpftrace

sysdig

dstat

sar

9. Container & Virtualisierung[edit]

Docker[edit]

docker stats

docker inspect

docker logs

Kubernetes[edit]

kubectl describe

kubectl logs

kubectl top

Virtualisierung[edit]

virsh

virt-top

Typische Probleme[edit]

zuviele Zugriffe[edit]

 
var/run/openvpn

.status auf undef prüfen, ob es zuviele sind

cat *.status | grep UNDEF | wc -l   (zählt die undef)

wenn ja, kann in der Einstellung die Anmeldungen pro Zeiteinheit herunter gesetzt werden

var/lcportal/persistent/dc/openvpn/server-tun0.conf

connect-freq 10 2    ( 10 Anmeldungen pro 2 sek)

Systemauslastung[edit]

top, htop, atop

Havarie-Plan

Contents