top of page


LLM, SLM 기반 추론 환경을 위한 모델 경량화 & 최적화가 중요한 이유!!
거대 언어 모델(Large Language Model, 이하 LLM)이나 소형 언어 모델(Small Language Model, 이하 SLM)을 프로덕션 환경에 배포하여 추론 작업을 수행할 때 GPU, NPU, 메모리 등 자원을 효율적으로...
Chang Sun Park
2024년 11월 26일2분 분량
조회수 0회
댓글 0개
bottom of page