Blog
Field notes from the DB.
Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.
- Build vs Buy·13 min
Grafana DBM build-vs-buy: what the 'we'll just use Prometheus' plan actually costs
postgres_exporter ships in an afternoon. Per-query digests, plan-flip detection, lock-chain graphs, anomaly bands — each of those costs 1–3 engineer-weeks. We measure the real build cost vs Obsfly's $39/DB and tell you when each side wins.
Read →
- AWS·11 min
RDS Performance Insights: where it stops and what you actually need next
PI is free up to 7 days, ships with every RDS, and surfaces top SQL by wait class. It also stops short on plan history, multi-host correlation, multi-engine fleets, alerting, and AI suggestions. Here's where the line is and what to bolt on.
Read →
- Comparison·11 min
pganalyze vs Obsfly: which Postgres monitoring tool is right for you
pganalyze is the gold standard for Postgres-only depth. Obsfly covers 9 databases at lower per-DB pricing with BYOC. The honest, dimension-by-dimension comparison — including what pganalyze does better.
Read →
- Comparison·12 min
Datadog DBM vs Obsfly: Funktions- und Preisvergleich
Der ehrliche Vergleich — Preise, Feature-Parität, Deployment-Modelle und was Datadog besser macht. Inklusive der 3 Fälle, in denen Datadog DBM 2026 die richtige Wahl ist.
Read →
- Oracle·11 min
Oracle ASH und AWR: ein Leitfaden für den Rest von uns
ASH und AWR sind zwei der besten Performance-Views, die je in einer Datenbank ausgeliefert wurden — aber beide sitzen hinter der Diagnostics-Pack-Lizenz. So holst du dir 90% des Werts, mit oder ohne Lizenz.
Read →
- Redis·12 min
Redis-Monitoring in Produktion: der Leitfaden 2026
INFO, slowlog, latency monitor, keyspace notifications, big-key sampling — was zu scrapen ist und die acht Metriken, die jeden Redis-Vorfall vorhersagen.
Read →
- Postgres·13 min
Postgres-Bloat und autovacuum: ein Tuning-Leitfaden 2026
Was Tabellen- und Index-Bloat kostet, wie autovacuum in 16+ funktioniert, die wichtigen Parameter — und Queries, die deine schlimmsten Übeltäter vor dem nächsten OOM finden.
Read →
- SQL Server·12 min
SQL Server Query Store: der Feldleitfaden, den die meisten Teams überspringen
Query Store ist der größte Grund, warum ein SQL-Server-Upgrade jenseits 2016 das Wochenende wert war. Die wichtigen Settings, die DMVs, die du wirklich brauchst, und wie du eine Plan-Regression in zwei Queries findest.
Read →
- MySQL·10 min
MySQL-Replica-Lag: 9 Ursachen, sortiert nach Häufigkeit
Seconds_Behind_Master ist eine lügende Ganzzahl. Hier ist eine echte Diagnosereihenfolge — single-threaded apply, lange Transaktionen, Schema-Migrationen, Netzwerk — mit dem SQL für jede.
Read →
- Elasticsearch·10 min
Elasticsearch Slow Log: das günstigste Performance-Tool, das du falsch konfigurierst
Default-Schwellen — 10s warn, 1s info — fangen die Queries, die deinen Cluster wirklich verletzen, nie ein. So tunest du den Slow Log pro Index und 3 Inzidenz-Muster, die nur er sauber sichtbar macht.
Read →
- Postgres·14 min
pg_stat_statements: der vollständige Leitfaden 2026
Jede Spalte, jede Falle, die Queries, die du heute ausführen solltest — und warum pg_stat_statements 2026 immer noch die nützlichsten 80 Zeilen Telemetrie in Postgres sind.
Read →
- ClickHouse·11 min
ClickHouse in Produktion: Monitoring, ohne selbst zur Hot-Spot-Query zu werden
system.query_log ist riesig. system.parts noch riesiger. Hier steht, was du wirklich scrapen solltest und wie ein ClickHouse-Cluster überwacht wird, ohne seine halbe CPU zu verbrennen.
Read →
- AI·9 min
AI für Datenbank-Query-Optimierung: was 2026 echt ist (und was nicht)
Zwei Jahre LLM-gestützte Query-Analyse in Produktion. Was AI wirklich gut kann, was nicht, warum Grounding wichtiger ist als Modellgröße, und wie BYO-LLM in regulierten Deployments funktioniert.
Read →
- Postgres·11 min
Warum dein Postgres-p99 lügt — und was du stattdessen tracken solltest
p99 über 1m-Fenster ist die meistgezeigte und irreführendste Zahl auf jedem DBM-Dashboard. Hier sind die Histogramm-Mathematik, die Saisonalitätsmathematik und ein vernünftigerer Default.
Read →
- Pricing·9 min
Wir haben Datadog DBM bei 50 Datenbanken zusammengezählt. Das ist die Rechnung.
Eine Zeile-für-Zeile-Aufschlüsselung dessen, was 50 Postgres + 12 MySQL + 8 Mongo 2026 wirklich auf Datadog DBM kosten — mit Wegen, ohne Werkzeugwechsel zu sparen.
Read →
- BYOC·14 min
Warum regulierte SaaS Datadog DBM nicht nutzen können — und der BYOC-Fix
Architektur eines BYOC-Observability-Deployments: wo Daten liegen, was die Grenze überquert und wie SOC2 / HIPAA / GDPR erfüllt werden, ohne UX zu opfern.
Read →
- Postgres·17 min
Postgres-Slow-Queries: 12 Ursachen und wie man jede findet
Ein praxiserprobtes Playbook zur Diagnose einer langsamen Postgres-Query in Produktion — von fehlenden Indizes über Plan-Flips bis hin zu aufgeblähten Tabellen — mit dem SQL für jede Ursache und der Lösung.
Read →
- Postgres·14 min
Postgres-Connection-Pooling: pgBouncer, RDS Proxy und die Mathematik, die du übersprungen hast
Warum max_connections der falsche Hebel ist, wie sich pgBouncer-Pool-Modi wirklich unterscheiden, und die Faustformel, die dir die richtige Pool-Größe sagt.
Read →
- Postgres·11 min
Postgres-Lock-Chains: die Session finden, die deine blockiert
Praktische Anleitung zu pg_locks, pg_blocking_pids und der rekursiven CTE, die dir die komplette Kette gibt — inklusive AccessExclusiveLocks, die deine DB still und leise lahmlegen.
Read →
- SRE·9 min
Datenbank-SLOs, die nicht nutzlos sind: eine funktionierende Definition
Die meisten DB-SLOs lauten 'CPU unter 80%'. Das ist ein Budget-Alarm, kein Service-Level-Ziel. Hier definiere einen SLO, den ein Executive unterschreibt und ein Engineer umsetzen kann.
Read →
- MySQL·13 min
MySQL Performance Schema vs. sys-Schema: ein Monitoring-Leitfaden 2026
Performance Schema ist unleserlich. sys-Schema ist freundlicher, aber verlustbehaftet. Hier steht genau, welches du für welche Produktionsfrage einsetzt — mit den acht Queries, die jeder MySQL-DBA auswendig kennen sollte.
Read →
- Postgres·16 min
EXPLAIN ANALYZE für Postgres: 2026 jede Zeile lesen
Das Vokabular, das aus einem Query-Plan eine Geschichte macht. Costs, rows, loops, buffers, timing — was alles 2026 (Pg 16+) bedeutet, und die vier Anti-Pattern, die man in fünf Sekunden erkennt.
Read →
- MongoDB·14 min
MongoDB-Performance-Monitoring in Produktion: Leitfaden 2026
Vier Oberflächen (serverStatus, db.stats, currentOp, profiler), eine sinnvolle Default-Konfiguration und wie man Replica-Lag, Oplog-Window und Aggregation-Pipeline-Kosten verstehen lernt.
Read →
- MongoDB·12 min
Sharded-MongoDB-Monitoring: die Metriken, die ein Ungleichgewicht vorhersagen
Chunk-Verteilung, Jumbo-Chunks, Balancer-Round-Time, heiße Shards. Die wenigen Metriken, die einen gesunden Sharded-Cluster von einem unterscheiden, der gleich rebalanciert werden muss.
Read →
- AI·12 min
Anomalieerkennung auf Datenbank-Metriken: warum Schwellenwerte versagen — und was funktioniert
Forecast-Bänder, Change-Point-Detection, multivariate Anomalie und die Saisonalitätsmathematik, die 'p99 über 200ms' standardmäßig zum falschen Alarm machen.
Read →
- DevOps·10 min
Schema-Migrationen überwachen: liefern, ohne die DB lahmzulegen
ALTER TABLE auf einer Milliarde-Zeilen-Tabelle ist die meistgefürchtete 30-Zeilen-PR. Hier ist das Monitoring vorher, währenddessen und nachher — für Postgres, MySQL und MongoDB.
Read →
- AI·11 min
Datenbank-Kapazitätsprognosen, die 30 Tage im Voraus warnen
Lineare Regression reicht nicht. ARIMA ist Overkill. Prophet funktioniert, wenn man weiß, welche externen Variablen man füttert. Ein praktisches Rezept für Forecasts mit 30 Tagen Vorlauf.
Read →
- Redis·8 min
Redis SLOWLOG: die unterschätzte Telemetrie, die die Hälfte deiner Vorfälle einfängt
Die meisten Teams shippen Redis mit Default-SLOWLOG-Settings und schauen nie hin. So tunest du, was extrahieren — und drei Vorfallsklassen, die nur in SLOWLOG auftauchen.
Read →
- Postgres·10 min
Postgres-Transaktions-ID-Wraparound: 4 Stunden bis zum schlimmsten Samstag
Wenn pg_stat_activity 'autovacuum (to prevent wraparound)' zeigt und deine Schreibrate sinkt, hast du 4 Stunden für richtige Arbeit, sonst wird die DB read-only. Hier ist das echte Runbook.
Read →
· · ·
Überwache deine Datenbanken wie deine Services.
Buche eine 30-minütige Demo. Wir besprechen deine Flotte und erstellen ein 30-Tage-Angebot.