Skip to content

Commit d9ddcc9

Browse files
committed
docs: Clarify hardware and OS compatibility in swarm training introduction
1 parent 70de579 commit d9ddcc9

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

docs/en/swarm_intro.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -38,7 +38,7 @@ Tinker提出了一个半分布式解耦架构(可惜只能训练Lora模型)
3838
即无法使用其他“母舰”的其他模型实现非共享参数多智能体训练,也不能方便地切换固定在环境变量和代码中的密钥和奖励参数,更不能在多个硬件之间随心流转。一旦遇到任何问题,只能终止整个进程返回到上一检查点。
3939

4040
而AgentJet Swarm蜂群训练模式开创了一种全新的训练模式。沿用前面的比喻,在蜂群模式下,研究者和Agent工程师可以自由地在一台或多台服务器上部署多艘“航空母舰”(Swarm Server,每个Server对应一个待训LLM模型)。
41-
然后从“陆基平台”(例如你的工作站、服务器、甚至是你的Macbook“起飞” 任意多个 Swarm Client 运行Agent工作流,形成一个多对多的训练体系:
41+
然后从“陆基平台”(例如你的工作站、服务器、甚至是你的Macbook,对于硬件、操作系统、智能体Runtime都没有任何限制)上 “起飞” 任意多个 Swarm Client 运行Agent工作流,形成一个多对多的训练体系:
4242

4343
- Swarm Client:负责读取数据集,运行Agent工作流,最后奖励信号返回给各个“母舰”。
4444
- Swarm Server:“母舰”负责维护训练推理CoLocate环境,提供vLLM/SGLang的api接口(附带AgentJet的自动context追踪 & 时间线合并能力,大幅加速训练),采集&归纳样本,并执行策略梯度计算。

0 commit comments

Comments
 (0)