PDF 문서에서 GPU 가속 처리로 고품질 질의응답(QA) 데이터를 자동 생성하고 LLM을 효율적으로 파인튜닝하는 솔루션입니다. Unstructured 라이브러리와 AWS Bedrock Claude로 도메인 특화 QA 쌍을 생성하고, LoRA 기법으로 경량 모델을 훈련합니다.
processing docker aws gpu cuda bedrock data-extraction pdf-generation claude unstructured distillation finetuning sagemaker pdf-text-extraction data-argumantation llm unsloth processing-job text-disti
-
Updated
Jun 5, 2025 - Jupyter Notebook