Blog

Field notes from the DB.

Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.

Pricing·2026-05-26·12 min read

Datadog DBM pricing in 2026: a real-world calculator (and what teams actually pay)

Datadog DBM list price says $35/DB-instance. The bill you get says $9,400/month. We break down host + DB-instance + APM + Infra + retention overages so you can model your actual number — and compare it line-by-line.

Read post →

Build vs Buy·13 min
Grafana DBM build-vs-buy: what the 'we'll just use Prometheus' plan actually costs
postgres_exporter ships in an afternoon. Per-query digests, plan-flip detection, lock-chain graphs, anomaly bands — each of those costs 1–3 engineer-weeks. We measure the real build cost vs Obsfly's $39/DB and tell you when each side wins.
Read →
AWS·11 min
RDS Performance Insights: where it stops and what you actually need next
PI is free up to 7 days, ships with every RDS, and surfaces top SQL by wait class. It also stops short on plan history, multi-host correlation, multi-engine fleets, alerting, and AI suggestions. Here's where the line is and what to bolt on.
Read →
Comparison·11 min
pganalyze vs Obsfly: which Postgres monitoring tool is right for you
pganalyze is the gold standard for Postgres-only depth. Obsfly covers 9 databases at lower per-DB pricing with BYOC. The honest, dimension-by-dimension comparison — including what pganalyze does better.
Read →
Comparison·12 min
Datadog DBM vs Obsfly: comparación de características y precios
La comparación honesta — precios, paridad de funciones, modelos de despliegue y lo que Datadog hace mejor. Incluye los 3 casos donde Datadog DBM sigue siendo la mejor opción en 2026.
Read →
Oracle·11 min
Oracle ASH y AWR: guía de campo para los demás
ASH y AWR son dos de las mejores vistas de rendimiento que ha enviado cualquier base de datos — pero ambas viven detrás de la licencia Diagnostics Pack. Cómo obtener el 90% del valor, con o sin ella.
Read →
Redis·12 min
Monitorización de Redis en producción: la guía 2026
INFO, slowlog, latency monitor, keyspace notifications, big-key sampling — qué extraer de cada uno y las 8 métricas que predicen cualquier incidente Redis.
Read →
Postgres·13 min
Bloat y autovacuum en Postgres: guía de tuning 2026
Lo que cuesta el bloat de tablas e índices, cómo funciona autovacuum en 16+, los parámetros que importan — y las consultas para encontrar tus peores ofensores antes del OOM.
Read →
SQL Server·12 min
SQL Server Query Store: la guía que la mayoría de equipos se salta
Query Store es la razón principal por la que migrar SQL Server más allá de 2016 valió el fin de semana. Las configuraciones que importan, las DMVs que realmente usas, y cómo cazar una regresión de plan en dos consultas.
Read →
MySQL·10 min
Lag de réplica MySQL: 9 causas, ordenadas por frecuencia
Seconds_Behind_Master es un entero mentiroso. Aquí va el orden real de diagnóstico — apply mono-hilo, transacciones largas, migraciones de esquema, red — con el SQL para cada una.
Read →
Elasticsearch·10 min
Elasticsearch slow log: la herramienta de rendimiento más barata mal configurada
Los thresholds por defecto — 10s warn, 1s info — nunca capturan las queries que realmente lastiman el cluster. Cómo afinar el slow log por índice, y 3 patrones de incidente que solo él revela.
Read →
Postgres·14 min
pg_stat_statements: la guía completa 2026
Cada columna, cada trampa, las consultas que deberías ejecutar hoy y por qué pg_stat_statements sigue siendo en 2026 las 80 líneas de telemetría más útiles de Postgres.
Read →
ClickHouse·11 min
ClickHouse en producción: monitoriza sin convertirte tú en el hot-spot
system.query_log es enorme. system.parts aún más. Aquí va lo que realmente debes extraer y cómo monitorizar un clúster ClickHouse sin gastar la mitad de su CPU en consultas de sistema.
Read →
AI·9 min
IA para optimización de queries de base de datos: qué es real en 2026 (y qué no)
Dos años enviando análisis de queries con LLM grounded en producción. Qué hace bien la IA, qué hace mal, por qué el grounding pesa más que el tamaño del modelo, y cómo funciona BYO LLM en despliegues regulados.
Read →
Postgres·11 min
Por qué tu p99 de Postgres miente — y qué medir en su lugar
El p99 en ventanas de 1 min es el número más mostrado y más engañoso en cualquier dashboard de DBM. Aquí va la matemática de histogramas, la de estacionalidad y un default más sensato.
Read →
Pricing·9 min
Sumamos Datadog DBM a 50 bases de datos. Esta es la factura.
Desglose línea por línea de lo que cuestan en 2026 50 Postgres + 12 MySQL + 8 Mongo en Datadog DBM, con maneras de reducirlo sin cambiar de herramienta.
Read →
BYOC·14 min
Por qué SaaS regulados no pueden usar Datadog DBM — y la solución BYOC
Arquitectura de un despliegue BYOC de observabilidad: dónde viven los datos, qué cruza la frontera y cómo cumplir SOC2 / HIPAA / GDPR sin renunciar al UX.
Read →
Postgres·17 min
Consultas lentas en Postgres: 12 causas y cómo encontrar cada una
Un playbook probado en campo para diagnosticar una consulta Postgres lenta en producción — desde índices faltantes hasta cambios de plan y tablas hinchadas — con el SQL de cada causa y la solución.
Read →
Postgres·14 min
Connection pooling en Postgres: pgBouncer, RDS Proxy y la matemática que te saltaste
Por qué max_connections es la palanca equivocada, en qué se diferencian de verdad los modos de pool de pgBouncer, y la fórmula informal para tu pool size correcto.
Read →
Postgres·11 min
Cadenas de bloqueos en Postgres: encuentra la sesión que bloquea la tuya
Recorrido práctico por pg_locks, pg_blocking_pids y la CTE recursiva que te da la cadena completa — incluidos los AccessExclusiveLocks que tumban tu DB en silencio.
Read →
SRE·9 min
SLOs de DB que no son inútiles: una definición práctica
La mayoría de SLOs de DB son 'CPU bajo 80%'. Eso es una alerta presupuestaria, no un objetivo de servicio. Aquí, cómo definir un SLO que un ejecutivo firma y un ingeniero ejecuta.
Read →
MySQL·13 min
MySQL Performance Schema vs sys schema: guía de monitorización 2026
Performance Schema es ilegible. sys schema es amistoso pero pierde detalle. Aquí, qué usar para cada pregunta de producción, con las 8 consultas que todo DBA de MySQL debería saber de memoria.
Read →
Postgres·16 min
EXPLAIN ANALYZE en Postgres: leer cada línea en 2026
El vocabulario que convierte un plan en historia. Costs, rows, loops, buffers, timing — lo que cada uno significa en 2026 (Pg 16+) y los 4 antipatrones que detectas en 5 segundos.
Read →
MongoDB·14 min
Monitorización de MongoDB en producción: guía 2026
Cuatro superficies (serverStatus, db.stats, currentOp, profiler), una configuración por defecto sensata y cómo razonar sobre el lag de réplica, la ventana de oplog y el coste de los pipelines de agregación.
Read →
MongoDB·12 min
Monitorización de MongoDB con sharding: las métricas que predicen el desequilibrio
Distribución de chunks, jumbo chunks, tiempo de ronda del balancer, shards calientes. Las pocas métricas que distinguen un clúster sano del que va a necesitar rebalanceo.
Read →
AI·12 min
Detección de anomalías en métricas de DB: por qué fallan los umbrales y qué sí funciona
Bandas de pronóstico, detección de cambio de régimen, anomalía multivariada y la matemática de estacionalidad que hace que 'p99 > 200ms' sea la alerta equivocada por defecto.
Read →
DevOps·10 min
Monitorizar migraciones de schema: desplegar sin tirar la DB
ALTER TABLE sobre una tabla de mil millones de filas es la PR de 30 líneas más temida. Aquí va la monitorización antes, durante y después — para Postgres, MySQL y MongoDB.
Read →
AI·11 min
Pronóstico de capacidad de DB que avisa con 30 días de antelación
La regresión lineal no basta. ARIMA es exagerado. Prophet funciona si sabes qué variables exógenas darle. Receta práctica para pronósticos con 30 días de adelanto.
Read →
Redis·8 min
Redis SLOWLOG: la telemetría infravalorada que captura la mitad de tus incidentes
La mayoría de equipos despliega Redis con SLOWLOG por defecto y nunca lo mira. Cómo ajustarlo, qué extraer — y las 3 clases de incidente que solo aparecen ahí.
Read →
Postgres·10 min
Wraparound de transacción Postgres: 4 horas para el peor sábado de tu vida
Cuando pg_stat_activity muestra 'autovacuum (to prevent wraparound)' y la escritura se frena, tienes 4 horas para hacerlo bien, o la DB se vuelve read-only. Este es el runbook real.
Read →

· · ·

Vigila tus bases como vigilas tus servicios.

Reserva una demo de 30 minutos. Especificamos tu flota juntos y cotizamos tu primer trato de 30 días.

Reservar demo Leer la documentación

Field notes from the DB.

Datadog DBM pricing in 2026: a real-world calculator (and what teams actually pay)

Grafana DBM build-vs-buy: what the 'we'll just use Prometheus' plan actually costs

RDS Performance Insights: where it stops and what you actually need next

pganalyze vs Obsfly: which Postgres monitoring tool is right for you

Datadog DBM vs Obsfly: comparación de características y precios

Oracle ASH y AWR: guía de campo para los demás

Monitorización de Redis en producción: la guía 2026

Bloat y autovacuum en Postgres: guía de tuning 2026

SQL Server Query Store: la guía que la mayoría de equipos se salta

Lag de réplica MySQL: 9 causas, ordenadas por frecuencia

Elasticsearch slow log: la herramienta de rendimiento más barata mal configurada

pg_stat_statements: la guía completa 2026

ClickHouse en producción: monitoriza sin convertirte tú en el hot-spot

IA para optimización de queries de base de datos: qué es real en 2026 (y qué no)

Por qué tu p99 de Postgres miente — y qué medir en su lugar

Sumamos Datadog DBM a 50 bases de datos. Esta es la factura.

Por qué SaaS regulados no pueden usar Datadog DBM — y la solución BYOC

Consultas lentas en Postgres: 12 causas y cómo encontrar cada una

Connection pooling en Postgres: pgBouncer, RDS Proxy y la matemática que te saltaste

Cadenas de bloqueos en Postgres: encuentra la sesión que bloquea la tuya

SLOs de DB que no son inútiles: una definición práctica

MySQL Performance Schema vs sys schema: guía de monitorización 2026

EXPLAIN ANALYZE en Postgres: leer cada línea en 2026

Monitorización de MongoDB en producción: guía 2026

Monitorización de MongoDB con sharding: las métricas que predicen el desequilibrio

Detección de anomalías en métricas de DB: por qué fallan los umbrales y qué sí funciona

Monitorizar migraciones de schema: desplegar sin tirar la DB

Pronóstico de capacidad de DB que avisa con 30 días de antelación

Redis SLOWLOG: la telemetría infravalorada que captura la mitad de tus incidentes

Wraparound de transacción Postgres: 4 horas para el peor sábado de tu vida

Vigila tus bases como vigilas tus servicios.