트랜스포머 이해하기 허깅페이스 트랜스포머 사용하기 GPU 효율적으로 사용하기(메모리 절약, 양자화 등) 모델 경량화 LLM 모델 서빙하기 추가해야할 사항 - 로컬 서버 실행 - vLLM 오류 LLM 애플리케이션 개발하기 임베딩 모델로 데이터 의미 압축하기