Kubecost의 1/100 메모리로? RustCost 실무 도입 가능성 문의

안녕하세요, 질문이 있어서 문의드립니다.

현재 Kubecost는 Prometheus와 Grafana 위에 구축되어 있습니다. Prometheus는 메트릭을 수집하고, 메트릭별로 데이터를 가변적으로 저장하기 때문에 자유도가 높은 장점이 있는 반면, 효율성이 낮아 리소스를 많이 소모하는 한계가 있다고 생각합니다.

이에 비해 RustCost는 Rust 기반의 경량화된 비용 분석 도구입니다. RustCost는 Prometheus 전체를 대체하려는 것이 아니라, Kubernetes 리소스 사용량과 비용을 효율적으로 파악할 수 있도록 다음과 같은 단위를 중심으로 메트릭을 저장하고 열람할 수 있습니다:

  • Node 단위: 클러스터 전체 리소스 소비 현황 파악

  • Pod 단위: 워크로드별 CPU, 메모리, 네트워크 사용량 확인

  • Namespace 단위: 팀/서비스별 비용 집계 및 비교

즉, Prometheus 대비 훨씬 적은 메모리와 CPU 자원으로도 “Kubernetes 비용 분석”의 핵심 기능을 제공하는 것을 목표로 하고 있습니다.

제가 생각하는 단계별 계획은 아래와 같습니다:

  • v0 (10월 10일): CPU, Memory

  • v1 (MVP): CPU, Memory, Storage (기본 PVC 크기), Network (bytes in/out)

  • v2 (Advanced): Storage class, ephemeral storage, GPU, egress detection, shared costs

  • v3 (Enterprise): Cloud billing API 연동, overhead allocation 정책, multi-cluster federation

UI, 안정성, 메모리, CPU 사용량, 저장 방식은 v1 단계에서 많이 개선할 예정이지만, 실질적인 기능은 위와 같이 단계별로 나눌 수 있을 것 같습니다.

제가 궁금한 점은, 만약 12월까지 v1까지만 진행해서
“Kubecost의 기능의 80~90%를 Kubecost 대비 1/100 메모리로 운영·확인 가능”
한 상태라면,

  1. 기업 실무진 입장에서도 이런 경량화된 도구에 도입 니즈가 있을지,

  2. 또는 추가적으로 꼭 필요한 기능이 무엇일지

멘토님의 의견을 여쭙고 싶습니다

2 Likes

FinOps & Platform Engineering 입장에서 보면, 많은 기업들이 현재 사용하고 있는 Cloud Resource 비용 효율성을 고려하고 있는 실정입니다. 참고로, Platform Engineering의 중요성에 대해 게시글 하나를 공유드립니다. (CloudBro portal에서 “Platform” / “플랫폼” / "Platform Engineering "단어로 검색하면 더 많은 자료가 있습니다.)

2 Likes