10 lines
383 B
Markdown
10 lines
383 B
Markdown
# 试验使用swift 对qwen3-8b进行grpo训练
|
||
- 数据集:modelscope提供数学
|
||
- 启动方法:external模式,因为在a6000上使用colocate方式启动会报内存不足,因此使用2张卡跑vllm,2张卡跑训练,基本都跑满
|
||
```bash
|
||
# start server
|
||
sh swift_server.sh # 要等到看到vllm服务启动
|
||
|
||
# start client
|
||
sh swift_client.sh # 启动训练任务
|
||
``` |