Blog
Field notes from the DB.
Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.
- Build vs Buy·13 min
Grafana DBM build-vs-buy: what the 'we'll just use Prometheus' plan actually costs
postgres_exporter ships in an afternoon. Per-query digests, plan-flip detection, lock-chain graphs, anomaly bands — each of those costs 1–3 engineer-weeks. We measure the real build cost vs Obsfly's $39/DB and tell you when each side wins.
Read →
- AWS·11 min
RDS Performance Insights: where it stops and what you actually need next
PI is free up to 7 days, ships with every RDS, and surfaces top SQL by wait class. It also stops short on plan history, multi-host correlation, multi-engine fleets, alerting, and AI suggestions. Here's where the line is and what to bolt on.
Read →
- Comparison·11 min
pganalyze vs Obsfly: which Postgres monitoring tool is right for you
pganalyze is the gold standard for Postgres-only depth. Obsfly covers 9 databases at lower per-DB pricing with BYOC. The honest, dimension-by-dimension comparison — including what pganalyze does better.
Read →
- Comparison·12 min
Datadog DBM vs Obsfly : comparaison fonctionnalités et tarifs
La comparaison honnête — prix, parité fonctionnelle, modèles de déploiement, et ce que Datadog fait mieux. Inclut les 3 cas où Datadog DBM reste le bon choix en 2026.
Read →
- Oracle·11 min
Oracle ASH et AWR : un guide de terrain pour nous autres
ASH et AWR sont parmi les meilleures vues de performance jamais livrées dans une base de données — mais elles sont derrière la licence Diagnostics Pack. Comment obtenir 90% de la valeur, avec ou sans elle.
Read →
- Redis·12 min
Monitoring Redis en production : le guide 2026
INFO, slowlog, latency monitor, keyspace notifications, big-key sampling — quoi scraper de chacun, et les huit métriques qui prédisent tous les incidents Redis.
Read →
- Postgres·13 min
Bloat et autovacuum Postgres : guide de tuning 2026
Le coût réel du bloat de tables et d'index, comment fonctionne autovacuum en 16+, les paramètres qui comptent — et les requêtes pour trouver vos pires offenseurs avant un OOM.
Read →
- SQL Server·12 min
SQL Server Query Store : le guide de terrain que la plupart des équipes ignorent
Query Store est la plus grosse raison pour laquelle migrer SQL Server au-delà de 2016 valait le week-end. Les bons paramètres, les DMV qu'on utilise vraiment, et comment attraper une régression de plan en deux requêtes.
Read →
- MySQL·10 min
Lag de réplica MySQL : 9 causes classées par fréquence
Seconds_Behind_Master est un entier menteur. Voici un véritable ordre de diagnostic — apply mono-thread, longues transactions, migrations de schéma, réseau — avec le SQL pour chaque.
Read →
- Elasticsearch·10 min
Elasticsearch slow log : l'outil de perf le moins cher, mal configuré chez la plupart
Les seuils par défaut — 10s warn, 1s info — n'attrapent jamais les requêtes qui font mal au cluster. Comment tuner le slow log par index, et 3 patterns d'incident que seul lui révèle proprement.
Read →
- Postgres·14 min
pg_stat_statements : le guide complet 2026
Chaque colonne, chaque piège, les requêtes à lancer aujourd'hui, et pourquoi pg_stat_statements reste en 2026 les 80 lignes de télémétrie les plus utiles de Postgres.
Read →
- ClickHouse·11 min
ClickHouse en production : surveiller sans devenir vous-même un hot-spot
system.query_log est énorme. system.parts encore plus. Voici ce qu'il faut vraiment scraper et comment monitorer un cluster ClickHouse sans consommer sa moitié de CPU sur des requêtes système.
Read →
- AI·9 min
L'IA pour l'optimisation de requêtes : ce qui est réel en 2026 (et ce qui ne l'est pas)
Deux ans à expédier de l'analyse de requêtes LLM-grounded en production. Ce que l'IA fait vraiment bien, ce qu'elle fait mal, pourquoi le grounding compte plus que la taille du modèle, et comment BYO LLM marche en déploiement régulé.
Read →
- Postgres·11 min
Pourquoi votre p99 Postgres ment — et quoi suivre à la place
Le p99 sur fenêtres d'1 min est le chiffre le plus affiché et le plus trompeur de tout tableau de bord DBM. Voici la math des histogrammes, la math de saisonnalité et une valeur par défaut plus saine.
Read →
- Pricing·9 min
Nous avons additionné Datadog DBM à 50 bases. Voici la facture.
Décomposition ligne par ligne de ce que coûtent vraiment 50 Postgres + 12 MySQL + 8 Mongo sur Datadog DBM en 2026, avec des moyens de réduire la facture sans changer d'outil.
Read →
- BYOC·14 min
Pourquoi les SaaS régulés ne peuvent utiliser Datadog DBM — et le correctif BYOC
Architecture d'un déploiement BYOC observabilité : où vivent les données, ce qui passe la frontière, comment satisfaire SOC2 / HIPAA / GDPR sans sacrifier l'UX.
Read →
- Postgres·17 min
Requêtes lentes Postgres : 12 causes et comment trouver chacune
Un playbook éprouvé pour diagnostiquer une requête Postgres lente en production — index manquants, changements de plan, tables ballonnées — avec le SQL pour chaque cause et la correction.
Read →
- Postgres·14 min
Connection pooling Postgres : pgBouncer, RDS Proxy et la math qu'on saute
Pourquoi max_connections est le mauvais bouton, ce qui distingue vraiment les modes de pool pgBouncer, et la formule de coin de table pour la bonne taille de pool.
Read →
- Postgres·11 min
Chaînes de verrous Postgres : trouver la session qui bloque la vôtre
Visite pratique de pg_locks, pg_blocking_pids et de la CTE récursive qui donne la chaîne complète — y compris les AccessExclusiveLocks qui plantent silencieusement votre base.
Read →
- SRE·9 min
Des SLOs DB qui ne sont pas inutiles : une définition opérationnelle
La plupart des SLOs DB sont 'CPU sous 80%'. C'est une alerte budget, pas un objectif. Voici comment définir un SLO qu'un dirigeant signe et qu'un ingénieur peut suivre.
Read →
- MySQL·13 min
MySQL Performance Schema vs sys schema : guide monitoring 2026
Performance Schema est illisible. sys schema est plus aimable mais lossy. Voici lequel utiliser pour quelle question en prod, avec les huit requêtes que tout DBA MySQL devrait connaître par cœur.
Read →
- Postgres·16 min
EXPLAIN ANALYZE pour Postgres : lire chaque ligne en 2026
Le vocabulaire qui transforme un plan en histoire. Costs, rows, loops, buffers, timing — ce que chacun signifie en 2026 (Pg 16+) et les 4 anti-patterns à repérer en cinq secondes.
Read →
- MongoDB·14 min
Monitoring MongoDB en production : guide 2026
Quatre surfaces (serverStatus, db.stats, currentOp, profiler), une config par défaut sensée et comment raisonner sur le lag de réplica, la fenêtre oplog et le coût des pipelines d'agrégation.
Read →
- MongoDB·12 min
Monitoring MongoDB sharded : les métriques qui prédisent le déséquilibre
Distribution des chunks, jumbo chunks, temps de round du balancer, shards chauds. La poignée de métriques qui distingue un cluster sain d'un qui va devoir rééquilibrer.
Read →
- AI·12 min
Détection d'anomalies sur métriques DB : pourquoi les seuils échouent et ce qui marche
Bandes de prévision, détection de changement de régime, anomalie multivariée et la math de saisonnalité qui rend 'p99 > 200ms' la mauvaise alerte par défaut.
Read →
- DevOps·10 min
Surveiller les migrations de schéma : déployer sans tomber la DB
ALTER TABLE sur une table d'un milliard de lignes est la PR de 30 lignes la plus crainte. Voici la surveillance avant, pendant et après — Postgres, MySQL, MongoDB.
Read →
- AI·11 min
Prévisions de capacité DB qui paginent 30 jours à l'avance
La régression linéaire ne suffit pas. ARIMA est exagéré. Prophet marche si vous savez quelles variables exogènes lui donner. Recette pratique pour des prévisions à 30 jours.
Read →
- Redis·8 min
Redis SLOWLOG : la télémétrie sous-estimée qui attrape la moitié de vos incidents
La plupart des équipes lancent Redis avec les SLOWLOG par défaut et ne regardent jamais. Voici comment le tuner, quoi extraire — et 3 classes d'incidents qui n'apparaissent que là.
Read →
- Postgres·10 min
Wraparound d'ID de transaction Postgres : 4 heures du pire samedi de votre vie
Quand pg_stat_activity affiche 'autovacuum (to prevent wraparound)' et que les écritures s'arrêtent, vous avez 4 heures pour faire les bonnes choses, sinon la DB passe en lecture seule. Voici le vrai runbook.
Read →
· · ·
Surveillez vos bases comme vos services.
Réservez une démo de 30 minutes. Nous spécifions votre flotte ensemble et chiffrons votre premier deal de 30 jours.