☁️ DB Schenker - Cilium으로 글로벌 물류를 혁신하다 - March 7, 2025

DB Schenker, Cilium으로 글로벌 네트워크 인프라를 최적화하다

글로벌 네트워크 운영의 과제

DB Schenker는 전 세계 1,850개 이상의 지점에서 72,700명 이상의 직원을 운영하며, 육상·항공·해상 운송을 제공하는 글로벌 물류 기업입니다. 이 방대한 운영을 뒷받침하는 IT 인프라는 수천 개의 서비스와 애플리케이션을 여러 Kubernetes 클러스터에서 실행하며, 단 8명의 플랫폼 엔지니어 팀이 이를 관리하고 있습니다.
이러한 인프라를 글로벌 수준으로 확장하는 것은 큰 도전이었습니다. 특히 Kafka 기반 생태계는 초당 백만 건 이상의 요청을 처리할 정도로 고성능과 안정성을 요구합니다.

기존 CNI의 한계와 전환의 필요성

초기에는 Calico를 CNI로 사용했지만, 플랫폼이 확장됨에 따라 성능과 가시성의 한계가 드러났습니다. 마이크로서비스 간 연결을 추적하기 위해 Wireshark와 같은 도구에 의존하는 것은 복잡하고 비효율적이었습니다. 실시간 모니터링 부재는 서비스 간 통신을 추적하는 데 큰 장애물이었습니다.

이러한 문제를 해결하기 위해 팀은 eBPF 기반 솔루션을 검토했고, Cilium을 도입하기로 결정했습니다. Calico eBPF 등도 검토했지만, Cilium은 구조적 우수성과 통합성에서 앞섰습니다.

Cilium으로의 전환과 개선 효과

Cilium의 Chaining 모드를 활용하여 기존 VPC CNI 환경을 유지하면서 점진적으로 전환을 진행했고, kube-proxy 제거와 eBPF 기반 트래픽 처리로 TCP 연결 속도와 지연 시간 모두 개선되었습니다.

또한 Cilium의 Hubble 도구를 통해 레이어 7 수준의 실시간 네트워크 가시성을 확보하게 되어 문제 해결 속도도 크게 향상되었습니다.

보안 및 서비스 메시 단순화

서비스 메시의 오픈소스 지원 중단을 계기로, DB Schenker는 기존 서비스 메시를 Cilium과 WireGuard 기반 암호화로 대체했습니다. 그 결과 아키텍처는 단순해지고 보안은 더욱 강화되었습니다.
Cilium의 네임스페이스 격리 및 세분화된 네트워크 정책 덕분에 제로 트러스트 보안 모델도 한층 강화되었습니다.

운영 간소화 및 효율 향상

Cilium 도입 후 Pod 스케줄링 속도 향상, 노드 준비 상태 최적화, 애플리케이션 복원력 향상, 사고 발생률 감소 등의 운영 안정성이 크게 개선되었습니다.
또한 마이크로서비스에서 별도의 서비스 메시 없이도 Cilium만으로 암호화와 가시성을 확보할 수 있어 운영 복잡성이 줄고, AWS 인프라의 효율적 활용으로 비용 절감 효과도 누렸습니다.

향후 계획

DB Schenker는 Gateway API레이어 7 수준의 보안 및 가시성 기능을 향후 도입 목표로 삼고 있습니다. Cilium은 DB Schenker의 플랫폼 전략에서 단순한 도구를 넘어 핵심 인프라 구성 요소로 자리 잡았습니다.

“Cilium은 단순한 도구가 아니라, 우리 플랫폼 성공의 핵심입니다.” – Amir Kheirkhahan, 플랫폼 엔지니어

[출처] DB Schenker | CNCF