CUDA_VISIBLE_DEVICES=0,1 \ swift rollout \ --model /data1/yuyr/qwen3-8b \ --tensor_parallel_size 2 \ --port 8000