본문 바로가기
Y
S
영삼넷
youngsam.net
프로그램
기술노트
뉴스
사전
자료실
커뮤니티
소개
TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
전체
AI
Frontend
Backend
Database
Infra
Etc
전체
2
건
최신순
조회순
추천순
#vLLM ✕
2
AI
3분 읽기
vLLM 1.1 LoRA 핫스왑 — 멀티 테넌트 LLM 서빙, 비용 50%↓
vLLM 1.1의 LoRA 핫스왑 기능으로 테넌트별 미세조정 모델을 한 GPU에 동거시켜 인프라 비용을 절반으로 줄인 운영기.
#vLLM
#LoRA
#MultiTenant
2026.05.18
1
AI
4분 읽기
vLLM 1.0 vs SGLang vs TGI — LLM 추론 서버 실측 비교
vLLM 1.0·SGLang·TGI 3대 LLM 추론 서버 실측. Llama 70B 처리량·레이턴시·메모리, 양자화 지원과 운영 부담을 워크로드별로 비교.
#vLLM
#SGLang
#TGI
2026.05.15