Latest revision as of 09:47, 16 January 2026

Werkzeugkasten[edit]

1. Systemzustand & Ressourcen (CPU, RAM, Load)[edit]

Grundlegend[edit]

top / htop – laufende Prozesse, CPU/RAM

atop – sehr detailliert (CPU, RAM, I/O, Netzwerk)

uptime – Load Average

free -h – Speicherübersicht

vmstat 1 – CPU, I/O, Speicher

Tiefergehend[edit]

pidstat – Prozessbezogene Statistiken

mpstat – CPU-Auslastung pro Core

numactl, numastat – NUMA-Analyse

2. Storage & I/O[edit]

Übersicht[edit]

df -hT – Dateisysteme & Typen

du -sh * – Speicherverbrauch

lsblk -f – Blockgeräte

mount, findmnt

I/O-Analyse[edit]

iostat -xz 1 – Latenz, I/O-Wait

iotop – Disk-Last pro Prozess

blktrace, blkparse – Low-Level

lsusb

Dateisysteme[edit]

fsck

tune2fs, dumpe2fs

xfs_repair, xfs_growfs

3. Netzwerk[edit]

Basis[edit]

ip a, ip r, ip n

ss -tulpn (Kernel)

netstat -tulpn (/proc/..)

ping, tracepath, traceroute

arp, ip neigh

Traffic & Debugging[edit]

tcpdump

termshark

iftop

nload

ethtool

Erweiterte Tools[edit]

conntrack

tc

mtr

4. Logs & Events[edit]

Standard[edit]

journalctl -xe

journalctl -u <service>

dmesg -T

/var/log/syslog, /var/log/messages

Analyse[edit]

grep, egrep, rg

awk, sed

less +F

Audit & Logrotation[edit]

logrotate -d

ausearch, auditctl

5. Prozesse & Services[edit]

systemd[edit]

systemctl status

systemctl list-units --failed

systemctl show

systemd-analyze blame

systemd-analyze critical-chain

Debugging[edit]

strace -p <PID>

lsof

pstree -ap

coredumpctl

6. Hardware & Kernel[edit]

lscpu, lsmem

lsusb, lspci

dmidecode

uname -a

lsmod, modprobe

sysctl -a

7. Sicherheit[edit]

last, lastlog, who

faillog

getenforce, sestatus

iptables -L -nv

nft list ruleset

8. Performance & Spezialtools[edit]

perf

bpftrace

sysdig

dstat

sar

9. Container & Virtualisierung[edit]

Docker[edit]

docker stats

docker inspect

docker logs

Kubernetes[edit]

kubectl describe

kubectl logs

kubectl top

Virtualisierung[edit]

virsh

virt-top

Typische Probleme[edit]

zuviele Zugriffe[edit]

 
var/run/openvpn

.status auf undef prüfen, ob es zuviele sind

cat *.status | grep UNDEF | wc -l   (zählt die undef)

wenn ja, kann in der Einstellung die Anmeldungen pro Zeiteinheit herunter gesetzt werden

var/lcportal/persistent/dc/openvpn/server-tun0.conf

connect-freq 10 2    ( 10 Anmeldungen pro 2 sek)

Systemauslastung[edit]

top, htop, atop

@@ Line 1: / Line 1: @@
-= Havarie-Plan =
+= Werkzeugkasten =
-<pre>
-== Werkzeugkasten ==
-== Systemzustand & Ressourcen (CPU, RAM, Load)==
+== 1. Systemzustand & Ressourcen (CPU, RAM, Load) ==
-Grundlegend
-top / htop – laufende Prozesse, CPU/RAM-Last
+=== Grundlegend ===
-atop – sehr detailliert, inkl. I/O & Netzwerk
+<code>top</code> / <code>htop</code> – laufende Prozesse, CPU/RAM
-uptime – Load Average
+<code>atop</code> – sehr detailliert (CPU, RAM, I/O, Netzwerk)
-free -h – Speicherbelegung
+<code>uptime</code> – Load Average
-vmstat 1 – CPU-Wait, I/O, Speicher
+<code>free -h</code> – Speicherübersicht
-watch -n1 free -h
+<code>vmstat 1</code> – CPU, I/O, Speicher
-Tiefergehend
+=== Tiefergehend ===
-pidstat – Prozessbezogene CPU/RAM/I/O-Statistik
+<code>pidstat</code> – Prozessbezogene Statistiken
-mpstat – CPU-Auslastung pro Core
+<code>mpstat</code> – CPU-Auslastung pro Core
-numactl, numastat – NUMA-Analyse (Server!)
+<code>numactl</code>, <code>numastat</code> – NUMA-Analyse
-️⃣ Storage & I/O-Probleme
+== 2. Storage & I/O ==
-Klassiker
-df -hT – Dateisysteme & Typen
+=== Übersicht ===
-du -sh * – Speicherfresser
+<code>df -hT</code> – Dateisysteme & Typen
-lsblk -f – Blockgeräte & Mounts
+<code>du -sh *</code> – Speicherverbrauch
-mount, findmnt
+<code>lsblk -f</code> – Blockgeräte
-I/O-Analyse
+<code>mount</code>, <code>findmnt</code>
-iostat -xz 1 – Latenz & I/O-Wait (sehr wichtig)
+=== I/O-Analyse ===
-iotop – Prozesse mit hoher Disk-Last
+<code>iostat -xz 1</code> – Latenz, I/O-Wait
-blktrace, blkparse – Low-Level (Expertenmodus)
+<code>iotop</code> – Disk-Last pro Prozess
-Dateisysteme
+<code>blktrace</code>, <code>blkparse</code> – Low-Level
-fsck – Konsistenzprüfung
+<code>lsusb</code>
-tune2fs, dumpe2fs
+=== Dateisysteme ===
-xfs_repair, xfs_growfs
+<code>fsck</code>
-️⃣ Netzwerk-Analyse & Connectivity
+<code>tune2fs</code>, <code>dumpe2fs</code>
-Basis
-ip a, ip r, ip n
+<code>xfs_repair</code>, <code>xfs_growfs</code>
-ss -tulpn – Ports & Services
+== 3. Netzwerk ==
-ping, tracepath, traceroute
+=== Basis ===
-arp, ip neigh
+<code>ip a</code>, <code>ip r</code>, <code>ip n</code>
-Traffic & Debugging
+<code>ss -tulpn</code>   (Kernel)
-tcpdump – unverzichtbar
+<code>netstat -tulpn</code>  (/proc/..)
-termshark – TUI-Frontend für tcpdump
+<code>ping</code>, <code>tracepath</code>, <code>traceroute</code>
-iftop – Live-Traffic pro Verbindung
+<code>arp</code>, <code>ip neigh</code>
-nload – Gesamttraffic
+=== Traffic & Debugging ===
-ethtool, ethtool -k/-S
+<code>tcpdump</code>
-Erweiterte Tools
+<code>termshark</code>
-conntrack, conntrack-tools
+<code>iftop</code>
-tc – Traffic Control
+<code>nload</code>
-mtr – Ping + Traceroute kombiniert
+<code>ethtool</code>
-️⃣ Logs & Events (oft der Schlüssel 🔑)
+=== Erweiterte Tools ===
-Standard
-journalctl -xe
+<code>conntrack</code>
-journalctl -u <service>
+<code>tc</code>
-dmesg -T
+<code>mtr</code>
-/var/log/syslog, /var/log/messages
+== 4. Logs & Events ==
-Analyse & Suche
+=== Standard ===
-grep, egrep, rg (ripgrep)
+<code>journalctl -xe</code>
-awk, sed
+<code>journalctl -u <service></code>
-less +F (Live-Follow)
+<code>dmesg -T</code>
-Log-Probleme
+<code>/var/log/syslog</code>, <code>/var/log/messages</code>
-logrotate -d
+=== Analyse ===
-ausearch, auditctl (Auditd)
+<code>grep</code>, <code>egrep</code>, <code>rg</code>
-️⃣ Prozesse, Services & Abstürze
+<code>awk</code>, <code>sed</code>
-Systemd
-systemctl status
+<code>less +F</code>
-systemctl list-units --failed
+=== Audit & Logrotation ===
-systemctl show <service>
+<code>logrotate -d</code>
-systemd-analyze blame
+<code>ausearch</code>, <code>auditctl</code>
-systemd-analyze critical-chain
+== 5. Prozesse & Services ==
-Debugging
+=== systemd ===
-strace -p <PID>
+<code>systemctl status</code>
-lsof -p <PID> / lsof -i
+<code>systemctl list-units --failed</code>
-pstree -ap
+<code>systemctl show</code>
-coredumpctl
+<code>systemd-analyze blame</code>
-️⃣ Hardware & Kernel
+<code>systemd-analyze critical-chain</code>
-Hardwareinfos
-lscpu, lsmem
+=== Debugging ===
-lsusb, lspci
+<code>strace -p <PID></code>
-dmidecode
+<code>lsof</code>
-free, numactl
+<code>pstree -ap</code>
-Kernel & Treiber
+<code>coredumpctl</code>
-uname -a
+== 6. Hardware & Kernel ==
-modprobe, lsmod
+<code>lscpu</code>, <code>lsmem</code>
-sysctl -a
+<code>lsusb</code>, <code>lspci</code>
-/proc, /sys
+<code>dmidecode</code>
-️⃣ Sicherheit & Zugriffe
+<code>uname -a</code>
-last, lastlog, who
+<code>lsmod</code>, <code>modprobe</code>
-faillog
+<code>sysctl -a</code>
-getenforce, sestatus (SELinux)
+== 7. Sicherheit ==
-ausearch, auditctl
+<code>last</code>, <code>lastlog</code>, <code>who</code>
-iptables -L -nv / nft list ruleset
+<code>faillog</code>
-️⃣ Performance- & Spezialtools (optional, aber stark)
+<code>getenforce</code>, <code>sestatus</code>
-perf – Kernel/CPU-Profiling
+<code>iptables -L -nv</code>
-bpftrace – moderne Live-Analyse
+<code>nft list ruleset</code>
-sysdig – Events & Container
+== 8. Performance & Spezialtools ==
-dstat – Alles auf einmal
+<code>perf</code>
-sar / sysstat – Historische Performance
+<code>bpftrace</code>
-️⃣ Container & Virtualisierung (falls relevant)
+<code>sysdig</code>
-Docker
-docker stats
+<code>dstat</code>
-docker inspect
+<code>sar</code>
-docker logs
+== 9. Container & Virtualisierung ==
-Kubernetes
+=== Docker ===
-kubectl describe
+<code>docker stats</code>
-kubectl logs
+<code>docker inspect</code>
-kubectl top
+<code>docker logs</code>
-Virtualisierung
+=== Kubernetes ===
-virsh
+<code>kubectl describe</code>
-virt-top
+<code>kubectl logs</code>
-🔟 Typische Fehlerfälle → Tool-Empfehlung
+<code>kubectl top</code>
-Problem	Tools
-Server „lahm“	top, vmstat, iostat, atop
+=== Virtualisierung ===
-Netzwerk spinnt	ip, ss, tcpdump, mtr
-Disk voll	df, du, lsof +L1
+<code>virsh</code>
-Service startet nicht	systemctl, journalctl
-Sporadische Hänger	sar, perf, bpftrace
-Kernel-Fehler	dmesg, journalctl -k
-</pre>
+<code>virt-top</code>
+= Typische Probleme =
 == zuviele Zugriffe ==
@@ Line 229: / Line 218: @@
 == Systemauslastung ==
-htop
+top, htop, atop

Difference between revisions of "Havarie-Plan"