Blog
Field notes from the DB.
Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.
- Redis·12 min
Monitorización de Redis en producción: la guía 2026
INFO, slowlog, latency monitor, keyspace notifications, big-key sampling — qué extraer de cada uno y las 8 métricas que predicen cualquier incidente Redis.
Read →
- Postgres·13 min
Bloat y autovacuum en Postgres: guía de tuning 2026
Lo que cuesta el bloat de tablas e índices, cómo funciona autovacuum en 16+, los parámetros que importan — y las consultas para encontrar tus peores ofensores antes del OOM.
Read →
- SQL Server·12 min
SQL Server Query Store: the field guide most teams skip
Query Store is the single biggest reason a SQL Server upgrade past 2016 was worth the weekend. The settings that matter, the DMVs you actually use, and how to catch a plan regression in two queries.
Read →
- MySQL·10 min
Lag de réplica MySQL: 9 causas, ordenadas por frecuencia
Seconds_Behind_Master es un entero mentiroso. Aquí va el orden real de diagnóstico — apply mono-hilo, transacciones largas, migraciones de esquema, red — con el SQL para cada una.
Read →
- Elasticsearch·10 min
Elasticsearch slow log: the cheapest performance tool you're misconfiguring
Default thresholds — 10s warn, 1s info — never catch the queries actually hurting your cluster. Here's how to tune the slow log per-index, what query / fetch / index split actually means, and 3 incident patterns only the slow log surfaces cleanly.
Read →
- Postgres·14 min
pg_stat_statements: la guía completa 2026
Cada columna, cada trampa, las consultas que deberías ejecutar hoy y por qué pg_stat_statements sigue siendo en 2026 las 80 líneas de telemetría más útiles de Postgres.
Read →
- ClickHouse·11 min
ClickHouse en producción: monitoriza sin convertirte tú en el hot-spot
system.query_log es enorme. system.parts aún más. Aquí va lo que realmente debes extraer y cómo monitorizar un clúster ClickHouse sin gastar la mitad de su CPU en consultas de sistema.
Read →
- AI·9 min
AI for database query optimization: what's real in 2026 (and what's not)
Two years of shipping LLM-grounded query analysis to production databases. What AI is genuinely good at, what it's bad at, why grounding beats model size, and how BYO LLM works in regulated deployments.
Read →
- Postgres·11 min
Por qué tu p99 de Postgres miente — y qué medir en su lugar
El p99 en ventanas de 1 min es el número más mostrado y más engañoso en cualquier dashboard de DBM. Aquí va la matemática de histogramas, la de estacionalidad y un default más sensato.
Read →
- Pricing·9 min
Sumamos Datadog DBM a 50 bases de datos. Esta es la factura.
Desglose línea por línea de lo que cuestan en 2026 50 Postgres + 12 MySQL + 8 Mongo en Datadog DBM, con maneras de reducirlo sin cambiar de herramienta.
Read →
- BYOC·14 min
Por qué SaaS regulados no pueden usar Datadog DBM — y la solución BYOC
Arquitectura de un despliegue BYOC de observabilidad: dónde viven los datos, qué cruza la frontera y cómo cumplir SOC2 / HIPAA / GDPR sin renunciar al UX.
Read →
- Postgres·17 min
Consultas lentas en Postgres: 12 causas y cómo encontrar cada una
Un playbook probado en campo para diagnosticar una consulta Postgres lenta en producción — desde índices faltantes hasta cambios de plan y tablas hinchadas — con el SQL de cada causa y la solución.
Read →
- Postgres·14 min
Connection pooling en Postgres: pgBouncer, RDS Proxy y la matemática que te saltaste
Por qué max_connections es la palanca equivocada, en qué se diferencian de verdad los modos de pool de pgBouncer, y la fórmula informal para tu pool size correcto.
Read →
- Postgres·11 min
Cadenas de bloqueos en Postgres: encuentra la sesión que bloquea la tuya
Recorrido práctico por pg_locks, pg_blocking_pids y la CTE recursiva que te da la cadena completa — incluidos los AccessExclusiveLocks que tumban tu DB en silencio.
Read →
- SRE·9 min
SLOs de DB que no son inútiles: una definición práctica
La mayoría de SLOs de DB son 'CPU bajo 80%'. Eso es una alerta presupuestaria, no un objetivo de servicio. Aquí, cómo definir un SLO que un ejecutivo firma y un ingeniero ejecuta.
Read →
- MySQL·13 min
MySQL Performance Schema vs sys schema: guía de monitorización 2026
Performance Schema es ilegible. sys schema es amistoso pero pierde detalle. Aquí, qué usar para cada pregunta de producción, con las 8 consultas que todo DBA de MySQL debería saber de memoria.
Read →
- Postgres·16 min
EXPLAIN ANALYZE en Postgres: leer cada línea en 2026
El vocabulario que convierte un plan en historia. Costs, rows, loops, buffers, timing — lo que cada uno significa en 2026 (Pg 16+) y los 4 antipatrones que detectas en 5 segundos.
Read →
- MongoDB·14 min
Monitorización de MongoDB en producción: guía 2026
Cuatro superficies (serverStatus, db.stats, currentOp, profiler), una configuración por defecto sensata y cómo razonar sobre el lag de réplica, la ventana de oplog y el coste de los pipelines de agregación.
Read →
- MongoDB·12 min
Monitorización de MongoDB con sharding: las métricas que predicen el desequilibrio
Distribución de chunks, jumbo chunks, tiempo de ronda del balancer, shards calientes. Las pocas métricas que distinguen un clúster sano del que va a necesitar rebalanceo.
Read →
- AI·12 min
Detección de anomalías en métricas de DB: por qué fallan los umbrales y qué sí funciona
Bandas de pronóstico, detección de cambio de régimen, anomalía multivariada y la matemática de estacionalidad que hace que 'p99 > 200ms' sea la alerta equivocada por defecto.
Read →
- DevOps·10 min
Monitorizar migraciones de schema: desplegar sin tirar la DB
ALTER TABLE sobre una tabla de mil millones de filas es la PR de 30 líneas más temida. Aquí va la monitorización antes, durante y después — para Postgres, MySQL y MongoDB.
Read →
- AI·11 min
Pronóstico de capacidad de DB que avisa con 30 días de antelación
La regresión lineal no basta. ARIMA es exagerado. Prophet funciona si sabes qué variables exógenas darle. Receta práctica para pronósticos con 30 días de adelanto.
Read →
- Redis·8 min
Redis SLOWLOG: la telemetría infravalorada que captura la mitad de tus incidentes
La mayoría de equipos despliega Redis con SLOWLOG por defecto y nunca lo mira. Cómo ajustarlo, qué extraer — y las 3 clases de incidente que solo aparecen ahí.
Read →
- Postgres·10 min
Wraparound de transacción Postgres: 4 horas para el peor sábado de tu vida
Cuando pg_stat_activity muestra 'autovacuum (to prevent wraparound)' y la escritura se frena, tienes 4 horas para hacerlo bien, o la DB se vuelve read-only. Este es el runbook real.
Read →
· · ·
Vigila tus bases como vigilas tus servicios.
Reserva una demo de 30 minutos. Especificamos tu flota juntos y cotizamos tu primer trato de 30 días.