Blog
Field notes from the DB.
Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.
- Redis·12 min
Redis-Monitoring in Produktion: der Leitfaden 2026
INFO, slowlog, latency monitor, keyspace notifications, big-key sampling — was zu scrapen ist und die acht Metriken, die jeden Redis-Vorfall vorhersagen.
Read →
- Postgres·13 min
Postgres-Bloat und autovacuum: ein Tuning-Leitfaden 2026
Was Tabellen- und Index-Bloat kostet, wie autovacuum in 16+ funktioniert, die wichtigen Parameter — und Queries, die deine schlimmsten Übeltäter vor dem nächsten OOM finden.
Read →
- SQL Server·12 min
SQL Server Query Store: the field guide most teams skip
Query Store is the single biggest reason a SQL Server upgrade past 2016 was worth the weekend. The settings that matter, the DMVs you actually use, and how to catch a plan regression in two queries.
Read →
- MySQL·10 min
MySQL-Replica-Lag: 9 Ursachen, sortiert nach Häufigkeit
Seconds_Behind_Master ist eine lügende Ganzzahl. Hier ist eine echte Diagnosereihenfolge — single-threaded apply, lange Transaktionen, Schema-Migrationen, Netzwerk — mit dem SQL für jede.
Read →
- Elasticsearch·10 min
Elasticsearch slow log: the cheapest performance tool you're misconfiguring
Default thresholds — 10s warn, 1s info — never catch the queries actually hurting your cluster. Here's how to tune the slow log per-index, what query / fetch / index split actually means, and 3 incident patterns only the slow log surfaces cleanly.
Read →
- Postgres·14 min
pg_stat_statements: der vollständige Leitfaden 2026
Jede Spalte, jede Falle, die Queries, die du heute ausführen solltest — und warum pg_stat_statements 2026 immer noch die nützlichsten 80 Zeilen Telemetrie in Postgres sind.
Read →
- ClickHouse·11 min
ClickHouse in Produktion: Monitoring, ohne selbst zur Hot-Spot-Query zu werden
system.query_log ist riesig. system.parts noch riesiger. Hier steht, was du wirklich scrapen solltest und wie ein ClickHouse-Cluster überwacht wird, ohne seine halbe CPU zu verbrennen.
Read →
- AI·9 min
AI for database query optimization: what's real in 2026 (and what's not)
Two years of shipping LLM-grounded query analysis to production databases. What AI is genuinely good at, what it's bad at, why grounding beats model size, and how BYO LLM works in regulated deployments.
Read →
- Postgres·11 min
Warum dein Postgres-p99 lügt — und was du stattdessen tracken solltest
p99 über 1m-Fenster ist die meistgezeigte und irreführendste Zahl auf jedem DBM-Dashboard. Hier sind die Histogramm-Mathematik, die Saisonalitätsmathematik und ein vernünftigerer Default.
Read →
- Pricing·9 min
Wir haben Datadog DBM bei 50 Datenbanken zusammengezählt. Das ist die Rechnung.
Eine Zeile-für-Zeile-Aufschlüsselung dessen, was 50 Postgres + 12 MySQL + 8 Mongo 2026 wirklich auf Datadog DBM kosten — mit Wegen, ohne Werkzeugwechsel zu sparen.
Read →
- BYOC·14 min
Warum regulierte SaaS Datadog DBM nicht nutzen können — und der BYOC-Fix
Architektur eines BYOC-Observability-Deployments: wo Daten liegen, was die Grenze überquert und wie SOC2 / HIPAA / GDPR erfüllt werden, ohne UX zu opfern.
Read →
- Postgres·17 min
Postgres-Slow-Queries: 12 Ursachen und wie man jede findet
Ein praxiserprobtes Playbook zur Diagnose einer langsamen Postgres-Query in Produktion — von fehlenden Indizes über Plan-Flips bis hin zu aufgeblähten Tabellen — mit dem SQL für jede Ursache und der Lösung.
Read →
- Postgres·14 min
Postgres-Connection-Pooling: pgBouncer, RDS Proxy und die Mathematik, die du übersprungen hast
Warum max_connections der falsche Hebel ist, wie sich pgBouncer-Pool-Modi wirklich unterscheiden, und die Faustformel, die dir die richtige Pool-Größe sagt.
Read →
- Postgres·11 min
Postgres-Lock-Chains: die Session finden, die deine blockiert
Praktische Anleitung zu pg_locks, pg_blocking_pids und der rekursiven CTE, die dir die komplette Kette gibt — inklusive AccessExclusiveLocks, die deine DB still und leise lahmlegen.
Read →
- SRE·9 min
Datenbank-SLOs, die nicht nutzlos sind: eine funktionierende Definition
Die meisten DB-SLOs lauten 'CPU unter 80%'. Das ist ein Budget-Alarm, kein Service-Level-Ziel. Hier definiere einen SLO, den ein Executive unterschreibt und ein Engineer umsetzen kann.
Read →
- MySQL·13 min
MySQL Performance Schema vs. sys-Schema: ein Monitoring-Leitfaden 2026
Performance Schema ist unleserlich. sys-Schema ist freundlicher, aber verlustbehaftet. Hier steht genau, welches du für welche Produktionsfrage einsetzt — mit den acht Queries, die jeder MySQL-DBA auswendig kennen sollte.
Read →
- Postgres·16 min
EXPLAIN ANALYZE für Postgres: 2026 jede Zeile lesen
Das Vokabular, das aus einem Query-Plan eine Geschichte macht. Costs, rows, loops, buffers, timing — was alles 2026 (Pg 16+) bedeutet, und die vier Anti-Pattern, die man in fünf Sekunden erkennt.
Read →
- MongoDB·14 min
MongoDB-Performance-Monitoring in Produktion: Leitfaden 2026
Vier Oberflächen (serverStatus, db.stats, currentOp, profiler), eine sinnvolle Default-Konfiguration und wie man Replica-Lag, Oplog-Window und Aggregation-Pipeline-Kosten verstehen lernt.
Read →
- MongoDB·12 min
Sharded-MongoDB-Monitoring: die Metriken, die ein Ungleichgewicht vorhersagen
Chunk-Verteilung, Jumbo-Chunks, Balancer-Round-Time, heiße Shards. Die wenigen Metriken, die einen gesunden Sharded-Cluster von einem unterscheiden, der gleich rebalanciert werden muss.
Read →
- AI·12 min
Anomalieerkennung auf Datenbank-Metriken: warum Schwellenwerte versagen — und was funktioniert
Forecast-Bänder, Change-Point-Detection, multivariate Anomalie und die Saisonalitätsmathematik, die 'p99 über 200ms' standardmäßig zum falschen Alarm machen.
Read →
- DevOps·10 min
Schema-Migrationen überwachen: liefern, ohne die DB lahmzulegen
ALTER TABLE auf einer Milliarde-Zeilen-Tabelle ist die meistgefürchtete 30-Zeilen-PR. Hier ist das Monitoring vorher, währenddessen und nachher — für Postgres, MySQL und MongoDB.
Read →
- AI·11 min
Datenbank-Kapazitätsprognosen, die 30 Tage im Voraus warnen
Lineare Regression reicht nicht. ARIMA ist Overkill. Prophet funktioniert, wenn man weiß, welche externen Variablen man füttert. Ein praktisches Rezept für Forecasts mit 30 Tagen Vorlauf.
Read →
- Redis·8 min
Redis SLOWLOG: die unterschätzte Telemetrie, die die Hälfte deiner Vorfälle einfängt
Die meisten Teams shippen Redis mit Default-SLOWLOG-Settings und schauen nie hin. So tunest du, was extrahieren — und drei Vorfallsklassen, die nur in SLOWLOG auftauchen.
Read →
- Postgres·10 min
Postgres-Transaktions-ID-Wraparound: 4 Stunden bis zum schlimmsten Samstag
Wenn pg_stat_activity 'autovacuum (to prevent wraparound)' zeigt und deine Schreibrate sinkt, hast du 4 Stunden für richtige Arbeit, sonst wird die DB read-only. Hier ist das echte Runbook.
Read →
· · ·
Überwache deine Datenbanken wie deine Services.
Buche eine 30-minütige Demo. Wir besprechen deine Flotte und erstellen ein 30-Tage-Angebot.