Blog
Field notes from the DB.
Benchmarks, plan diffs, lock-chain post-mortems, and opinions on what real DB observability should look like in 2026.
- Build vs Buy·13 min
Grafana DBM build-vs-buy: what the 'we'll just use Prometheus' plan actually costs
postgres_exporter ships in an afternoon. Per-query digests, plan-flip detection, lock-chain graphs, anomaly bands — each of those costs 1–3 engineer-weeks. We measure the real build cost vs Obsfly's $39/DB and tell you when each side wins.
Read →
- AWS·11 min
RDS Performance Insights: where it stops and what you actually need next
PI is free up to 7 days, ships with every RDS, and surfaces top SQL by wait class. It also stops short on plan history, multi-host correlation, multi-engine fleets, alerting, and AI suggestions. Here's where the line is and what to bolt on.
Read →
- Comparison·11 min
pganalyze vs Obsfly: which Postgres monitoring tool is right for you
pganalyze is the gold standard for Postgres-only depth. Obsfly covers 9 databases at lower per-DB pricing with BYOC. The honest, dimension-by-dimension comparison — including what pganalyze does better.
Read →
- Comparison·12 min
Datadog DBM vs Obsfly:機能と価格の徹底比較
正直な比較 — 価格、機能パリティ、デプロイモデル、そしてDatadogが優れている点。2026年にDatadog DBMが正しい選択となる3つのケースを含む。
Read →
- Oracle·11 min
Oracle ASHとAWR:残りの私たちのためのフィールドガイド
ASHとAWRはどのデータベースが出荷した中でも最高のパフォーマンスビューの2つ — しかし両方ともDiagnostics Packライセンスの裏側にある。ライセンスがあってもなくても、価値の90%を引き出す方法。
Read →
- Redis·12 min
本番Redis監視:2026年ガイド
INFO、slowlog、latency monitor、keyspace notifications、big-keyサンプリング — 何を取得し、8つのメトリクスで全インシデントを予測する。
Read →
- Postgres·13 min
Postgres ブロートと autovacuum:2026年チューニングガイド
テーブル・インデックスのブロートのコスト、Pg 16+でのautovacuum、重要なパラメーター — そしてOOMの前に最悪のテーブルを見つけるクエリ。
Read →
- SQL Server·12 min
SQL Server Query Store:多くのチームが見落とすフィールドガイド
Query StoreはSQL Server 2016以降へのアップグレードが週末に値する最大の理由。重要な設定、実際に使うDMV、そして2つのクエリでプラン回帰を捕まえる方法。
Read →
- MySQL·10 min
MySQLレプリカ遅延:発生頻度順の9つの原因
Seconds_Behind_Masterは嘘つきの整数。本物の診断順序 — シングルスレッドapply、長時間トランザクション、スキーマ移行、ネットワーク — 各原因のSQL付き。
Read →
- Elasticsearch·10 min
Elasticsearchスローログ:設定を間違えている最も安価なパフォーマンスツール
デフォルト閾値(10秒warn、1秒info)では、本当にクラスタを苦しめるクエリを決して捕まえられない。インデックスごとのチューニング方法と、スローログでしか綺麗に見えない3つのインシデントパターン。
Read →
- Postgres·14 min
pg_stat_statements: 2026年完全ガイド
全カラム、すべての落とし穴、今すぐ実行すべきクエリ、そしてpg_stat_statementsが2026年でもPostgresで最も有用な80行のテレメトリである理由。
Read →
- ClickHouse·11 min
本番ClickHouse:自身がホットスポットにならない監視
system.query_logは巨大。system.partsはさらに巨大。実際に取得すべき内容と、自身が上位クエリにならずにClickHouseクラスタを監視する方法。
Read →
- AI·9 min
データベースクエリ最適化のためのAI:2026年に何が本物で、何がそうでないか
本番でLLMグラウンディングされたクエリ分析を出荷した2年間。AIが本当に得意なこと、苦手なこと、なぜグラウンディングがモデルサイズより重要か、規制された環境でのBYO LLMの実装方法。
Read →
- Postgres·11 min
Postgresのp99が嘘をつく理由 — 代わりに追うべき指標
1分ウィンドウのp99はすべてのDBMダッシュボードで最も表示され、最も誤解を招く数字。ヒストグラムと季節性の数学、そしてより妥当なデフォルトを示します。
Read →
- Pricing·9 min
Datadog DBMを50データベースで集計。これが請求書だ。
2026年に50 Postgres + 12 MySQL + 8 MongoがDatadog DBMで実際にいくらかかるかを行ごとに分解、ツール変更なしで削減する方法も。
Read →
- BYOC·14 min
規制対象のSaaSがDatadog DBMを使えない理由 — そしてBYOCによる解決
BYOC可観測性デプロイのアーキテクチャ:データの所在、境界を越えるもの、UXを犠牲にせずSOC2 / HIPAA / GDPRを満たす方法。
Read →
- Postgres·17 min
Postgres スロークエリ:12 の原因と特定方法
本番環境で遅いPostgresクエリを診断する実証済みのプレイブック — インデックス不足、プラン変更、肥大化テーブルなど — 各原因のSQLと修正法を提示。
Read →
- Postgres·14 min
Postgres コネクションプーリング:pgBouncer、RDS Proxy、見逃した計算
max_connectionsが間違ったツマミな理由、pgBouncerプールモードの本当の違い、そしてプールサイズの実用的な計算式。
Read →
- Postgres·11 min
Postgres ロックチェーン:ブロックしているセッションを見つける方法
pg_locks、pg_blocking_pids、そしてフルチェーンを取得する再帰CTE — DBを静かに落とすAccessExclusiveLocksを含めて。
Read →
- SRE·9 min
実際に役立つデータベースSLO:現実的な定義
ほとんどのDB SLOは「CPU 80%以下」 — それは予算アラートでありサービスレベル目標ではない。経営層が承認しエンジニアが実行できるSLOの定義方法。
Read →
- MySQL·13 min
MySQL Performance Schema vs sys schema:2026年モニタリングガイド
Performance Schemaは読みづらい。sys schemaは親しみやすいが情報量が落ちる。本番のどの質問にどちらを使うか、MySQL DBA必須の8クエリ付き。
Read →
- Postgres·16 min
Postgres EXPLAIN ANALYZE:2026年に全行を読む
クエリプランを物語に変える語彙。Costs、rows、loops、buffers、timing — 2026年 (Pg 16+) における意味、そして5秒で見抜ける4つのアンチパターン。
Read →
- MongoDB·14 min
本番環境のMongoDBパフォーマンス監視:2026年ガイド
4つのサーフェス (serverStatus、db.stats、currentOp、profiler)、現実的なデフォルト、レプリカラグ・oplogウィンドウ・集約パイプラインコストの考え方。
Read →
- MongoDB·12 min
シャーディングMongoDB監視:不均衡を予測する指標
チャンク分布、ジャンボチャンク、バランサーラウンド時間、ホットシャード。健全なシャードクラスタと、これからリバランスが必要なクラスタを区別する少数の指標。
Read →
- AI·12 min
データベースメトリクスの異常検知:しきい値が機能しない理由とその代替
予測バンド、変化点検出、多変量異常、そして「p99 > 200ms」をデフォルトで誤ったアラートにする季節性の数学。
Read →
- DevOps·10 min
スキーママイグレーション監視:DBを落とさず本番投入
10億行テーブルのALTER TABLEは最も恐れられる30行のPR。Postgres、MySQL、MongoDBで、事前・実行中・事後の監視を解説。
Read →
- AI·11 min
30日先のブリーチを捕まえるデータベース容量予測
線形回帰では足りない。ARIMAはやり過ぎ。Prophetは適切な外生変数を与えれば機能する — 30日前にページする実践レシピ。
Read →
- Redis·8 min
Redis SLOWLOG:インシデントの半分を捕まえる見過ごされたテレメトリ
多くのチームがデフォルトのSLOWLOG設定で本番投入し見ない。チューニング方法、何を取得すべきか — そしてSLOWLOGにしか現れない3種類のインシデント。
Read →
- Postgres·10 min
PostgresトランザクションIDラップアラウンド:最悪の土曜まで4時間
pg_stat_activityが「autovacuum (to prevent wraparound)」を表示し書き込みが止まり始めたら、正しく対処するための4時間。間違えればDBはread-onlyに。本物のランブック。
Read →