Skip to content

Latest commit

 

History

History
20 lines (20 loc) · 1.65 KB

第五节笔记.md

File metadata and controls

20 lines (20 loc) · 1.65 KB

LMDeploy 大模型量化部署实践

大模型部署

188b4c2f1d7bbf934e253cbca3525c4 36f50b6d355a275ae3ef755c0cd2791

LMDeploy

880931ecba90f5966f26bdb0f073ce6

大模型量化

dfefbb54bd472271ad2318d0cf393c0 255d34f491fea3c802e574d26910b2a

推理引擎Turbomind

3c06a10aadbbc75abf23c070f2fa35f

大模型的C/S服务架构

50f099727c6c2a72b9336ad704ffa8b

学到的几种模型推理方式

  • TurboMind 推理+命令行本地对话 b7998c563e1edfe1f769a7addba1f7f
  • TurboMind推理+API服务 127723a2d18797a7b996ce91da4d022
  • Gradio 作为前端 Demo,TurboMind 推理作为后端 21aa5dd49c1cf7ee805e25d703cc33c