How would you measure observability coverage across services? [Advanced]

Question

Accepted Answer

I measure observability coverage by checking whether every production service has owned metrics, logs, traces, dashboards, alerts, SLOs, runbooks, and correlation metadata. Coverage should be measured against operational outcomes, not just whether an agent is installed. Required attributes include service name, owner/team, environment, version, cluster, and runbook links. Coverage should include signal quality: useful labels, structured logs, trace propagation, and actionable alerts. Review coverage as part of production readiness and monthly operational reviews.

How would you measure observability coverage across services? [Advanced]

Answer

Technical explanation

Hands-on example

More Observability interview questions