최근 저희 회사에서는 Azure Kubernetes Service(AKS)를 많이 사용하고 있는데, 클러스터 운영 비용이 급격히 증가하고 있는 상황입니다. 그래서 FinOps 원칙을 적용해서 비용을 최적화하고 싶습니다. 하지만 AKS 환경에서는 어디서부터 시작해야 하는지 조금 막막합니다.
구체적으로는 다음과 같은 부분을 알고 싶습니다:
어떤 메트릭을 모니터링해야 가장 먼저 비용 최적화에 도움이 되는지
노드 풀 구성(예: 스팟 인스턴스 활용 등)에서 어떤 전략을 사용해야 하는지
워크로드 리소스 요청(requests)와 제한(limits)을 어떻게 설정해야 하는지
Azure에서 제공하는 FinOps 관련 도구나 서비스가 무엇이 있는지
AKS를 FinOps 관점에서 제대로 운영하려면 어떤 접근 방법을 가져야 하는지 경험 기반으로 조언을 구하고 싶습니다.