OpenTelemetry 졸업 이후 바뀐 Datadog의 전략

CNCF가 미니애폴리스 Observability Summit North America에서 OpenTelemetry의 졸업을 발표하면서 이 프로젝트를 사실상의 오픈소스 관찰가능성 표준으로 공식 인정했습니다.

졸업 자체는 누구나 예상하던 수순이었는데, OpenTelemetry가 이미 오래전부터 CNCF에서 Kubernetes 다음으로 빠르게 성장한 프로젝트였기 때문입니다. 정작 눈여겨봐야 할 대목은 이 발표를 받아든 Datadog이 OpenTelemetry와 맞서는 대신 끌어안는 쪽으로 방향을 틀었다는 점이고, 그 선회 안에 관찰가능성 시장이 앞으로 어디로 흘러갈지에 대한 답이 담겨 있습니다.

TL;DR

  1. 수집 레이어가 commodity로 굳어졌습니다. OpenTelemetry 졸업은 데이터를 어떻게 모으느냐가 더 이상 차별화 요소가 아니라는 공식 선언이고, 12,000명이 넘는 기여자와 2,800개가 넘는 회사가 함께 만든 표준이 모두에게 열렸습니다.

  2. Datadog이 그 사실을 전략으로 받아들였습니다. 자체 SDK로 데이터 수집을 묶던 방식을 내려놓고, OpenTelemetry로 들어온 데이터를 자기 분석 플랫폼에서 처리하는 쪽으로 무게중심을 옮겼습니다.

  3. 다음 경쟁은 AI observability인데 아직 표준이 없습니다. GenAI와 MCP 관찰가능성 컨벤션은 2026년 5월 현재까지도 Development 단계에 머물러 있어서, 수집은 졸업했지만 그 위 AI 영역은 미완성으로 남아 있는 시차가 다음 승부처입니다.

[1] 수집은 더 이상 무기가 아니다

먼저 OpenTelemetry가 무엇인지부터 짚어보겠습니다. 소프트웨어가 돌아갈 때 그 안에서 무슨 일이 벌어지는지 밖에서 들여다보는 일을 관찰가능성이라고 부르고, 로그와 메트릭과 트레이스라는 세 종류의 데이터를 통해 그 상태를 파악합니다. OpenTelemetry는 이 데이터를 표준 형식으로 수집하고 전송하는 오픈소스 프레임워크입니다.

핵심 가치는 벤더 종속에서 벗어나게 해준다는 데 있습니다. 예전에는 Datadog을 쓰면 Datadog 방식으로, New Relic을 쓰면 New Relic 방식으로 데이터를 모아야 했고, 도구를 바꾸려면 수집 코드를 전부 다시 짜야 했습니다. OpenTelemetry는 한 번 계측하면 어디로든 보낼 수 있는 구조를 만들어 이 문제를 풀었습니다.

졸업이 뜻하는 바는 간단합니다. 외부 보안 감사와 거버넌스 리뷰를 통과해 기업이 핵심 시스템에 마음 놓고 써도 된다는 공식 인증을 받았다는 의미입니다. 숫자가 그 규모를 말해주는데, 지난 12개월간 JavaScript API 패키지가 13.6억 회 이상, Python API 패키지가 13억 회 넘게 다운로드됐고 두 패키지 모두 2026년 4월에 월간 다운로드 신기록을 세웠습니다. Alibaba와 Anthropic, Bloomberg, Capital One, eBay 같은 회사들이 이 표준으로 시스템을 모니터링하고 있습니다. 수집 표준이 공짜로 모두에게 열렸다는 것은 데이터를 어떻게 모으느냐로는 더 이상 차별화할 수 없다는 뜻이고, 수집은 그렇게 commodity가 되었습니다.

[2] 가장 위협받을 회사가 가장 먼저 움직였다

여기서부터가 이번 글의 핵심입니다. 수집이 commodity가 되면 가장 크게 타격받을 회사가 어디일까요? 데이터 수집과 분석을 한데 묶어 비싸게 팔아온 Datadog 같은 관찰가능성 SaaS 벤더입니다. 그렇다면 Datadog은 OpenTelemetry에 맞섰을까요? 오히려 그 반대로 움직였습니다.

Datadog은 작년 말 OpenTelemetry GenAI 시맨틱 컨벤션을 네이티브로 지원하기 시작하면서, LLM 애플리케이션을 OpenTelemetry로 한 번만 계측하면 기존 Collector 파이프라인이나 Datadog Agent를 거쳐 코드 변경 없이 Datadog에서 분석되도록 만들었습니다. 더 눈여겨볼 지점은 Datadog이 이전 방식의 한계를 스스로 인정했다는 데 있는데, 그전까지 Datadog의 LLM Observability는 자체 SDK를 요구했고 OpenTelemetry를 쓰는 팀은 계측을 이중으로 유지하거나 collector 정책을 우회해야 했습니다. Datadog은 이 마찰을 인정하고 자기 SDK 강제를 풀었습니다.

Datadog의 공식 입장은 OpenTelemetry와 Datadog이 양자택일의 관계가 아니라는 것이고, 실제로 Datadog은 Observability Summit의 창립 전략 파트너이자 OpenTelemetry 커뮤니티 행사의 후원사입니다. New Relic과 Dynatrace 역시 같은 방향으로 GenAI 컨벤션 네이티브 지원에 들어갔습니다. 이 움직임이 말해주는 것은 벤더들이 수집 레이어의 싸움을 내려놓았다는 사실인데, 그 싸움은 OpenTelemetry가 이미 이겼기 때문입니다. 대신 그들은 OpenTelemetry로 들어온 데이터를 자기 분석 플랫폼에서 처리하는 자리로 옮겨갔고, 이는 Datadog 스스로 수집은 commodity이며 분석이야말로 자기 영역이라고 행동으로 인정한 셈입니다.

[3] 돈은 언제나 위층으로 도망쳐

원자재 가격이 내려가면 그 위 가공 단계가 새로운 수익원이 되는 구조는 그동안 여러 시장에서 반복됐고, 관찰가능성 시장도 같은 길을 걷고 있습니다. 아래 레이어가 commodity로 내려앉으면 그 위 레이어가 새 마진 영역으로 떠오르기 마련입니다.

관찰가능성 시장의 레이어를 정리하면, 수집은 OpenTelemetry가 가져간 commodity이고 저장과 파이프라인은 인프라이며 분석과 UX는 새 마진 영역, 그리고 AI agent observability는 아직 임자가 없는 신규 영역입니다. Datadog의 전략 변화는 이 구조를 고스란히 보여주는데, 수집에서 위로 두 칸 올라가 분석과 AI observability에서 승부를 보겠다는 선택이기 때문입니다.

전략의 언어로 풀어보면 더 또렷해집니다. 예전에는 도구를 바꾸려면 코드를 다시 짜야 했던 탓에 Datadog이 그 전환 비용으로 고객을 묶어둘 수 있었는데, OpenTelemetry 표준화가 그 묶임을 빠르게 풀어버렸습니다. 이제는 코드를 다시 짜지 않고도 분석 도구를 갈아탈 수 있게 됐으니까요. Datadog이 SDK 강제를 푼 것은 이 변화에 저항하는 대신 올라탄 선택이었고, 막아봐야 고객이 경쟁사로 떠날 뿐이라는 판단이 깔려 있습니다.

[4] 공짜라는 말의 함정

세상에 공짜는 없듯… (?) 실무에서 자주 빠지는 오해가 하나 있습니다. OpenTelemetry가 공짜라고 해서 관찰가능성 비용 자체가 사라지는 것은 아니라는 점인데, 데이터를 저장하고 분석하는 백엔드는 여전히 비용이 듭니다.

다만 Collector를 잘 운영하면 그 비용을 줄일 여지가 큽니다. Collector는 데이터를 받아 가공한 뒤 원하는 곳으로 보내는 중간 파이프라인이라, 여기서 불필요한 데이터를 미리 걸러내고 샘플링하면 SaaS로 흘러가는 데이터량이 줄어 청구액이 내려갑니다. 비용 절감 사례는 많이 보고되지만 정직하게 짚자면 구체적인 절감률을 제시하는 자료는 대부분 Datadog 대체품을 파는 벤더의 자체 측정치라 독립적으로 검증된 수치는 제한적입니다. Collector 운영으로 비용을 크게 줄일 수 있다는 방향 자체는 사실이되, 특정 절감률을 그대로 믿기보다 자기 환경에서 직접 손익분기를 계산하는 편이 안전한데, SaaS 라이선스 비용과 Collector 운영에 드는 인건비, 대략 정규직 0.5명에서 2명 사이의 부담을 나란히 놓고 따져보는 것입니다.

[5] AI agent observability의 표준은 누가 가져가게 될까

상위 레이어의 핵심은 AI agent observability입니다. AI 에이전트가 늘면서 AI가 어떤 프롬프트로 어떤 응답을 만들었고 토큰을 얼마나 썼으며 어떤 도구를 호출했는지 추적하는 일이 새로운 영역으로 떠올랐고, MCP 도구 호출 추적도 여기에 포함됩니다.

OpenTelemetry는 이를 GenAI 시맨틱 컨벤션이라는 규약으로 표준화하는 중이고, gen_ai 네임스페이스로 AI 관련 데이터의 표준 형식을 정하고 있습니다. 그런데 여기에 중요한 단서가 붙는데, 이 GenAI와 MCP 컨벤션이 2026년 5월 현재까지도 Development 단계에 머물러 stable 전 단계라는 점입니다. 수집 레이어 본체는 졸업했지만 그 위 AI observability 표준은 아직 완성되지 않은 셈입니다. Datadog과 New Relic, Dynatrace가 이미 GenAI 컨벤션 네이티브 지원에 들어간 것은 표준이 굳기 전에 미리 자리를 선점하려는 움직임으로 읽히고, 수집 표준의 도입은 폭발적인데 그 위 AI observability 표준의 활용은 이제 막 시작됐다는 두 숫자의 분리가 다음 12개월의 핵심 신호입니다.

[6] 사람인은 졸업을 기다리지 않았다

사람인은 OpenTelemetry와 SigNoz를 조합해 관찰가능성 환경을 자체 구축하고 운영하면서, 자사 기술블로그에 OpenTelemetry가 이미 사실상의 표준으로 대우받는다고 적었는데, 이 글이 CNCF 졸업보다 두 달 앞선 3월에 나왔다는 점이 흥미 롭습니다. 글로벌 재단의 공식 인증을 기다리지 않고, 커뮤니티가 표준으로 받아들였다는 판단만으로 이미 운영에 들였다는 뜻이기 때문입니다.

세 축을 나란히 놓으면 사람인의 선택이 어디쯤 있는지 보입니다. 글로벌에서는 도구 카테고리가 수집은 OpenTelemetry, 분석은 선택이라는 구도로 재정의를 마쳤고, APAC에서는 7월 29일부터 30일까지 PACIFICO Yokohama에서 열리는 KubeCon Japan 2026이 observability 트랙으로 이 흐름을 확산시키고 있습니다. 한국 대기업과 SI의 기본 제안이 여전히 Datadog과 New Relic, Dynatrace 라이선스 위주라는 점을 떠올리면, 사람인은 한국 시장 평균보다 한발 앞서 움직인 사례인 셈입니다.

바로 여기에 한국 기업과 SI가 정렬할 수 있는 자리가 보입니다. 수집은 OpenTelemetry로 commodity가 됐고 AI observability는 신규 미개척 영역이라는 양면을 동시에 읽어내는 것인데, 사람인처럼 SaaS 라이선스에만 기대지 않고 Collector 운영 역량과 AI observability 설계 역량을 자체 자산으로 쌓아가는 길입니다. 글로벌과 APAC보다 한 박자 늦은 이 시차가 오히려 한국 기업과 SI에게 그 역량을 준비할 시간을 벌어주는 것은 아닐까요?

이 변화를 어떻게 쓸 것인가?

  • 클라우드 엔지니어라면 Collector 운영 능력이 다음 12개월의 차별 역량이 될 텐데, exporter 다중화와 샘플링, tail-based 룰 같은 실무 학습의 효율이 가장 높습니다.
  • CTO와 기술 리더라면 관찰가능성 총비용을 다시 계산할 시점인데, SaaS 라이선스 종속 비용과 Collector 운영 인건비의 손익분기를 직접 분석하되 벤더가 내미는 절감률은 자체 측정치인 만큼 자기 환경에서 다시 따져보는 편이 안전합니다.
  • CFO와 경영진이라면 관찰가능성 비용을 FinOps 스코프에 넣어 통합 관리할 필요가 있는데, 수집이 공짜라도 저장과 분석의 청구서는 그대로 남기 때문입니다.
  • Pre Sales라면 수집의 commodity화와 AI observability라는 신규 영역을 두 축의 메시지로 엮어 차별화할 수 있고, 단순 라이선스 제안에서 운영과 설계 역량 제안으로 무게를 옮기는 것이 관건입니다.
  • AI 인프라 의사결정자라면 GenAI와 MCP 컨벤션이 아직 Development 단계라는 점을 전제에 두고 움직이되, 지금 gen_ai 표준을 미리 채택해두면 stable 전환 시점에 한발 앞설 수 있습니다.

:person_raising_hand: 알고 보면 좋은 분석 포인트

첫째, Datadog의 전략 변화가 운영 레이어 이론의 살아있는 증거라는 점입니다. 벤더 본인이 수집 싸움을 내려놓고 분석으로 자리를 옮겼고, 자체 SDK 강제를 풀어 OpenTelemetry를 끌어안았다는 것은 수집은 commodity이며 마진은 위층에 있다는 사실을 행동으로 인정한 신호입니다. IREN-Mirantis와 Backstage, SAP 분석에서 만난 그 패턴이 관찰가능성 시장에서도 다시 반복되고 있는 것은 아닐까요?

둘째, 도입과 활용이 분리되는 다음 신호입니다. 수집 표준의 도입은 폭발적이지만 그 위 AI observability 표준은 아직 Development 단계로 미성숙하고, Datadog과 New Relic, Dynatrace가 표준이 굳기 전에 미리 자리를 잡는 움직임이 이 분리를 잘 보여줍니다. 도입 숫자만 보면 판이 다 끝난 것 같지만 활용 레이어는 이제 막 출발선을 떠났습니다.

셋째, 한국 시장의 시차가 곧 기회라는 점입니다. 한국 대기업과 SI는 아직 SaaS 라이선스 위주이지만 사람인 같은 테크 기업은 졸업보다 두 달 앞서 이미 OpenTelemetry를 운영에 들였고, 글로벌과 APAC보다 한 박자 늦은 이 시차가 오히려 한국 기업과 SI에게 운영과 설계 역량을 자체 자산으로 쌓을 시간을 벌어줍니다. 단순 라이선스 재판매라는 틀에서 벗어날 길이 여기 열려 있는 것은 아닐까요?

참고 자료

2개의 좋아요