장애처리를 위한 AI 학습 사례가 있을까요?

Jeehee · December 4, 2025, 9:51am

장애 발생 시, 복구 시간을 단축하기 위해, 내부 기술 문서와 장애 정보, 로그 정보 등의 내부 데이터를 RAG 학습하고 파이프라인에 어떻게 연동하는 사례가 있을까요?

JeongsikKang · December 4, 2025, 12:34pm

질문하신 의도랑 조금 거리는 있는것 같지만, 이런 글도 도움이 되실까요 ?

https://medium.com/@b0ld8/automated-incident-response-workflows-with-n8n-and-prometheus-0fbffdabc92f

개인적으로는 모델에 많은 정보를 다 먹여? 주기보다는, “생각과 판단 그리고 플래닝이 필요한 부분을 agent로”, ”실시간으로 시스템 확인이 필요한 부분을 mcp로” 적절히 구분해서 나에게 맞는 워크플로우를 구성하는 것이 맞지 않을까 정도로 생각하고 있습니다. RAG는 아무래도 레이턴시가 있을 수 있으니…. (참.. 저도 요즘 이 주제로 고민을 하고 있긴 합니다. )

manager · December 4, 2025, 1:56pm

질문을 보니 10월에 클라우드브로 행사에서 봤던 장애 처리 SRE LLM 파이프라인 구축 사례가 떠오르네요~

Topic		Replies	Views
🚀 Autonomous CloudOps Agent 구축 스토리 공유 - SRE & DevOps 엔지니어들을 위한 새로운 시도! Bro's Insights devops , ai , agent , sre , monitoring , cloudops , autonomous , incidentresponse , automation	0	124	September 6, 2025
The Evolution of Automation: The Rise of Agents Bro's Insights ai , automation	3	25	December 2, 2025
AI Agent, MCP와 K8s 연관성 그리고 엔지니어의 자세 관련 문의 - 이명일(@3477) Bro님 행사 사전 질문 Ask a Question sre , question , mcp	5	135	November 27, 2025
🇰🇷 09월 18일(목) 한국 - 아이디어에서 구현까지 – AI 에이전트 자체 호스팅 방법 Live 참여 Events & Meetups cncf , aiagent , cloudnativelive	20	66	October 8, 2025
AI Agent 와 Agentic AI는 다른 개념일까요?! Bro's Insights	2	66	June 14, 2025

장애처리를 위한 AI 학습 사례가 있을까요?

Related topics