AI 관련 글을 보다 보면 요즘 자주 보이는 단어가 있습니다.바로 sLLM과 vLLM입니다.이름이 비슷해서 같은 종류의 기술처럼 보이지만, 실제로는 역할이 다릅니다. sLLM은 어떤 모델을 쓸 것인가에 가까운 개념이고, vLLM은 그 모델을 어떻게 빠르고 효율적으로 돌릴 것인가에 가까운 기술입니다.쉽게 말하면 하나는 모델 쪽 이야기이고, 다른 하나는 추론 엔진과 서빙 쪽 이야기입니다.그래서 최근에는 “큰 모델이냐 작은 모델이냐”만 보는 게 아니라, 작은 모델을 실제 서비스에 어떻게 올릴지까지 함께 고민하는 흐름이 강해졌습니다. 이 지점에서 sLLM과 vLLM이 자주 같이 언급됩니다.#sLLM #vLLM #LLM추론엔진 #소형언어모델 #AI서빙 #LLM배포 #생성형AIsLLM이란 무엇일까sLLM은 보통 S..