ML/MMLOps 관련 정보 - Ray의 llmperf 공개! - 클라우드 환경(AWS, GCP)과 온프레미스에서 모두 작동

jerry · June 18, 2025, 1:40am

Berkeley RISELab에서 최초 개발, 학계 및 업계에서 적극 채택하고 있는 다양한 Ray Project 중에, IBM이 오픈소스로 공개하고자 제안한 llm-perf는 CNCF의 Cloud Native AI 워킹 그룹, CNCF 커뮤니티에서 활발하게 논의가 되고 있습니다.

클라우드 기반 자동 실행: AWS/GCP에서 Terraform 기반 인프라 구성 및 테스트 자동화
다양한 서빙 백엔드 지원: vLLM, TGI, HuggingFace, OpenAI API 등
정량적 벤치마크 제공: 지연 시간, 처리량, 비용, 정확도까지 통합 평가
LLM 서빙 튜닝 가이드 포함: 컨커런시, 배치 크기, 토크나이저 속도 등 세밀 조정

LLM 성능 비교, 서빙 최적화, 비용 효율 분석까지 한 번에 해결하고 싶다면, 지금 바로 llmperf를 활용해보세요!

Topic		Replies	Views
MLOps/FinOps - Kubeflow를 사용한 머신러닝 모델 학습 시, GPU 비용에 대한 고민 Ask a Question mlops , kubeflow , finops , gpu	2	30	June 18, 2025
☁️ 카카오페이 - AWS 기반 MLOps 플랫폼 구축 사례: 금융 컴플라이언스를 고려한 효율적인 머신러닝 운영 Bro's Lounge aws , mlops , use-case , 카카오페이	0	13	April 19, 2025
쿠버네티스 환경에서 LLM 추론 최적화 Ask a Question mlops , ai , question	1	34	May 6, 2025
Rag-llm 서빙 관련 Ask a Question mlops	1	9	June 30, 2025
GenAI 프로덕션 배포를 위한 MLOps 실전 플레이북 Bro's Lounge	0	81	June 23, 2025

ML/MMLOps 관련 정보 - Ray의 llmperf 공개! - 클라우드 환경(AWS, GCP)과 온프레미스에서 모두 작동

Related topics