AI 시대에 같은 문제를 두고도 누군가는 “안 될 이유”를 먼저 말하고, 누군가는 “일단 해보자”고 밀어붙입니다. 이 글에서는 그 차이가 성격이 아니라 **각자가 살아온 조직 환경(실패 비용, 책임 소재, 자원 설계)**에서 비롯된다는 관점을 정리하고, 제가 겪은 EKS/Spot 운영 고민을 예로 들어 신중함과 추진력을 함께 쓰는 방법을 공유합니다.
신중함과 낙관주의는 ‘성향’이 아니라 ‘환경의 학습 결과’입니다
저는 “안 될 이유를 찾는 사람”을 단순히 부정적이라고 보지 않습니다. 특히 작은 조직에서 인프라를 책임졌던 경험이 있다면, 실패는 곧 장애/비용 폭탄/신뢰 하락으로 직결되기 쉽습니다. 이때의 신중함은 다음과 같은 방어 기제이자 현실 감각입니다.
- 실패 비용이 크다(한 번의 실수가 재앙)
- 책임 소재가 명확하다(“누가 이거 승인했지?”가 곧 “누가 뒤집어쓰지?”)
- 인프라/운영 여력이 작다(대응 인력이 없다)
반대로 리소스가 풍부한 조직에서는 “실패해도 괜찮다”는 경험이 축적되기 쉽습니다. 그 결과 빠른 실행이 가능해지고, 특히 AI 같은 도구를 활용해 실험 → 학습 → 개선 루프를 가볍게 돌릴 수 있습니다.
즉, 신중함과 낙관주의는 상충이 아니라 각 환경이 만들어낸 서로 다른 생존 전략에 가깝습니다.
제가 겪은 “낭비를 피하려다, 다른 낭비를 만든” EKS 사례
저는 한때 EKS 테스트 구성을 하면서 하루마다 클러스터를 생성/삭제를 반복한 적이 있습니다. 당시 제 문제의식은 단순했습니다.
- “지원 부족을 변명으로 쓰고 싶지는 않다”
- “낭비를 최대한 줄이고 싶다”
- “클러스터를 켜두면 비용이 불어난다(통제 불가능하다)”
그런데 팀에서는 다른 관점을 이야기했습니다.
- “클라우드 비용보다 **인건비(사람 시간)**가 더 비싸다”
- “매일 갈아엎는 방식은 반복 작업/검증/대기 시간으로 생산성을 태운다”
여기서 중요한 건 “누가 맞냐”가 아니라, 낭비의 정의가 달랐다는 사실입니다.
- 저는 낭비를 청구서(cost) 중심으로 봤고,
- 팀은 낭비를 시간(인지부하, 반복 작업, 대기) 중심으로 봤습니다.
이 프레임 차이는 AI 시대에도 그대로 확장됩니다. “일단 해보자”는 사람은 보통 시간을 기준으로 최적화하고, “안 될 이유”를 찾는 사람은 실패 비용(운영/장애/보안/예산)을 기준으로 최적화합니다.
“가능/불가능”보다 먼저 봐야 하는 것: 자원 인벤토리
대화를 하면서 제가 깨달은 포인트는 이거였습니다.
- 저는 가능/불가능을 판단하기 전에, 자동으로 “내가 활용할 수 있는 자원”부터 계산하고 있었습니다.
- 그런데 그 자원이 빈약하면 결론이 쉽게 “안 됨”으로 굳습니다.
- 그러다 보면 스스로도 “나는 무조건 부정적으로 말하나?”라는 느낌을 받게 됩니다.
이때 유용한 전환은:
- “안 된다”를 결론으로 두지 않고,
- “지금 자원으로는 A는 어렵고, B로 줄이면 가능하다”로 바꾸는 것입니다.
즉, 신중함을 거절이 아니라 대안 설계 능력으로 바꾸는 접근입니다.
Spot vs On-Demand: 비용 문제가 아니라 “리스크 배치” 문제였습니다
저는 자원 이야기를 하다 보니 자연스럽게 Spot 노드 vs On-Demand 노드로 사고가 수렴했습니다. 처음엔 “기술로 비용을 줄이자”가 목표였지만, 곧 이런 결론에 닿았습니다.
- “최소 On-Demand 베이스가 필요하다”
- “비용 최적화가 오히려 확장/운영의 병목이 될 수 있다”
Spot은 비용을 낮추는 대신 중단(interruption) 리스크를 가져옵니다. 그래서 이 선택은 사실 비용 문제가 아니라 “어떤 리스크를 어디에 둘 것인가” 문제입니다.
- Spot: 비용 리스크 ↓ / 중단 리스크 ↑ / 운영 복잡도 ↑
- On-Demand: 비용 리스크 ↑ / 안정성 ↑ / 운영 예측 가능성 ↑
제가 잡은 방향은 “최저 비용”이 아니라:
- 예측 가능한 비용 + 신뢰성을 먼저 확보하고,
- 그 위에서 최적화는 “가능한 범위”에서 하자는 쪽이었습니다.
“최소 자원 운영”과 “확장 준비”는 분리할 수 있습니다
현재 트래픽이 몰리지 않는 환경이라면, 저도 최소 자원으로 효율적으로 운영하는 것이 맞다고 봅니다. 다만 제가 걱정한 건 다른 리스크였습니다.
- 최소 자원 운영이 “소극적이고 부정적인 확장 태도”로 굳어지는 것 자체가 미래 리스크가 될 수 있다
여기서 핵심은 이 두 가지를 분리하는 것입니다.
- 런타임 비용/자원은 작게 가져가되
- 설계/자동화/관측/복구 능력은 확장 전제로 연습한다
즉, “지금 돈을 안 쓰는 것”과 “나중에 커질 준비를 안 하는 것”을 동일시하지 않는 겁니다.
AI를 신중함의 적이 아니라 “체크리스트를 지우는 도구”로 쓰기
원본 요약의 결론이 좋았습니다. 두 관점은 대립이 아니라 보완 관계입니다. 저는 특히 AI를 다음처럼 쓰는 게 실용적이라고 느꼈습니다.
- 신중한 사람이 가진 체크리스트(안 될 이유)를 AI로 빠르게 검증/분해합니다.
- “안 된다”를 “어떤 조건이면 된다”로 바꾸는 대안을 생성합니다.
- 실행파가 놓치는 리스크(운영/보안/비용 상한)를 체크리스트로 고정합니다.
예를 들면, 제가 했던 “최소 On-Demand 베이스” 같은 결론도 사실은
비용 리스크를 0으로 만들려는 시도에서 리스크를 통제 가능한 상한으로 제한하는 시도로 전환한 결과였습니다. 이런 전환을 AI와 함께 더 빨리 만들 수 있을거라 기대합니다.
마무리: 신중함은 브레이크가 아니라 ‘조향 장치’입니다
“안 될 이유를 찾는 사람”과 “일단 해보자”는 사람은 서로의 반대편이 아니라, 같은 문제를 다른 비용 함수로 최적화하는 사람들일 뿐입니다. 저는 이제 신중함을 “거절”이 아니라 “리스크를 배치하고 상한을 설계하는 능력”으로 쓰고, AI를 그 과정의 가속기로 활용해보려 합니다.