We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
1 parent 70de579 commit d9ddcc9Copy full SHA for d9ddcc9
docs/en/swarm_intro.md
@@ -38,7 +38,7 @@ Tinker提出了一个半分布式解耦架构(可惜只能训练Lora模型)
38
即无法使用其他“母舰”的其他模型实现非共享参数多智能体训练,也不能方便地切换固定在环境变量和代码中的密钥和奖励参数,更不能在多个硬件之间随心流转。一旦遇到任何问题,只能终止整个进程返回到上一检查点。
39
40
而AgentJet Swarm蜂群训练模式开创了一种全新的训练模式。沿用前面的比喻,在蜂群模式下,研究者和Agent工程师可以自由地在一台或多台服务器上部署多艘“航空母舰”(Swarm Server,每个Server对应一个待训LLM模型)。
41
-然后从“陆基平台”(例如你的工作站、服务器、甚至是你的Macbook)“起飞” 任意多个 Swarm Client 运行Agent工作流,形成一个多对多的训练体系:
+然后从“陆基平台”(例如你的工作站、服务器、甚至是你的Macbook,对于硬件、操作系统、智能体Runtime都没有任何限制)上 “起飞” 任意多个 Swarm Client 运行Agent工作流,形成一个多对多的训练体系:
42
43
- Swarm Client:负责读取数据集,运行Agent工作流,最后奖励信号返回给各个“母舰”。
44
- Swarm Server:“母舰”负责维护训练推理CoLocate环境,提供vLLM/SGLang的api接口(附带AgentJet的自动context追踪 & 时间线合并能力,大幅加速训练),采集&归纳样本,并执行策略梯度计算。
0 commit comments