This website requires JavaScript.
Explore
Help
Register
Sign In
NASP
/
argus-cluster
Watch
53
Star
0
Fork
0
You've already forked argus-cluster
Code
Issues
Pull Requests
Actions
Packages
Projects
Releases
Wiki
Activity
argus-cluster
/
specs
/
mvp
/
v3.8
/
requirements.md
yuyr
686739fea2
v3.8 model serving 部署成功
2026-01-06 22:43:29 +08:00
404 B
Raw
Blame
History
Unescape
Escape
通过ray serve
(
后端vllm
)
来动态拉起llm
,
支持多模型application部署
,
默认一个模型只有一个replica
,
用户配置可以多个
用户可以删除(下线)模型
可以指定模型用几张卡
通过WebUI来进行配置
,
查看当前部署的模型列表
,
以及可以查看详情
模型路径可以使用common
,
也可以用户自己指定user路径