argus/deployment_new/templates/server/docs/TROUBLESHOOTING_zh.md
yuyr 34cb239bf4 完成H20服务器部署及重启测试 (#51)
当前部署情况
- h1: 部署server & client
- h2: 部署client
- 部署2025-11-25
- 部署目录:  /home2/argus/server  ,  /home2/argus/client
- 部署使用账号:argus

网络拓扑:
- h1 作为docker swarm manager
- h2 作为worker加入docker swarm
- docker swarm 上创建overlay network

访问方式:
- 通过ssh到h1服务器,端口转发 20006-20011 端口到笔记本本地;
- 门户网址:http://localhost:20006/dashboard

部署截图:
![image.png](/attachments/86c1a7af-dacc-4ba7-a182-f7cefd4e6427)
![image.png](/attachments/06f20852-771c-4264-b031-e6acd0f6ea1c)
![image.png](/attachments/091ab5a8-95bf-466f-a394-3255dcb49735)

注意事项:
- server各容器使用域名作为overlay network上alias别名,实现域名访问,当前版本禁用bind作为域名解析,原因是容器重启后IP变化场景bind机制复杂且不稳定。
- client 构建是内置安装包,容器启动时执行安装流程,后续重启容器跳过安装步骤。
- UID/GID:部署使用 argus账号 uid=2133, gid=2015。

Reviewed-on: #51
Reviewed-by: sundapeng <sundp@mail.zgclab.edu.cn>
Reviewed-by: xuxt <xuxt@zgclab.edu.cn>
Reviewed-by: huhy <husteryezi@163.com>
2025-11-25 15:54:29 +08:00

644 B
Raw Blame History

故障排查Server

  • 端口占用:查看 安装报告_*.md 中端口表;如需修改,编辑 compose/.env 后执行 docker compose ... up -d
  • 组件未就绪:
    • Master: curl http://127.0.0.1:${MASTER_PORT}/readyz -I
    • ES: curl http://127.0.0.1:${ES_HTTP_PORT}/_cluster/health
    • Grafana: curl http://127.0.0.1:${GRAFANA_PORT}/api/health
    • Prometheus TCP: exec 3<>/dev/tcp/127.0.0.1/${PROMETHEUS_PORT}
  • 域名解析:进入 argus-web-proxyargus-master-sys 容器:getent hosts master.argus.com
  • Swarm/Overlay检查 docker network ls | grep argus-sys-net,或 docker node ls