build imageaws ecr-public get-login-password --region us-east-1 | docker login --username AWS --password-stdin public.ecr.aws/q9t5s3a7 && docker build --build-arg max_jobs=16 --build-arg buildkite_commit=29431defe7282f70f66b035c3ecca26585bc2de5 --build-arg USE_SCCACHE=1 --tag public.ecr.aws/q9t5s3a7/vllm-ci-test-repo:29431defe7282f70f66b035c3ecca26585bc2de5 --target test --progress plain . && docker push public.ecr.aws/q9t5s3a7/vllm-ci-test-repo:29431defe7282f70f66b035c3ecca26585bc2de5

Ran in 30m 0s

Neuron Testbash .buildkite/run-neuron-test.sh

Documentation Build

Ran in 3m 34s

Async Engine, Inputs, Utils, Worker Test

Ran in 4m 47s

Basic Correctness Test

Ran in 5m 9s

Core Test

Ran in 4m 40s

Entrypoints Test

Ran in 4m 6s

Distributed Tests (4 GPUs)

Ran in 4m 26s

Metrics, Tracing Test

Ran in 3m 45s

PyTorch Fullgraph Smoke Test

Ran in 4m 6s

Plugin Tests (2 GPUs)

Ran in 3m 32s

Python-only Installation Test

Chunked Prefill Test

Regression Test

Engine Test

V1 Test

Examples Test

Prefix Caching Test

Samplers Test

LogitsProcessor Test

Speculative decoding tests

1/4

LoRA Test 1

2/4

LoRA Test 2

3/4

LoRA Test 3

4/4

LoRA Test 4

PyTorch Fullgraph Test

1/4

Kernels Test 1

2/4

Kernels Test 2

3/4

Kernels Test 3

4/4

Kernels Test 4

Tensorizer Test

Benchmarks

Quantization Test

LM Eval Small Models

Encoder Decoder tests

OpenAI-Compatible Tool Use

Basic Models Test

Language Models Test (Standard)

Language Models Test (Extended)

Multi-Modal Models Test (Standard)

Multi-Modal Models Test (Extended) 1

Multi-Modal Models Test (Extended) 2

Custom Models Test

Distributed Comm Ops Test

Distributed Tests (2 GPUs)

Multi-step Tests (4 GPUs)

Pipeline Parallelism Test

LoRA TP Test (Distributed)

Weight Loading Multiple GPU Test

2 Node Tests (4 GPUs in total)./.buildkite/run-multi-node-test.sh /vllm-workspace/tests 2 2 public.ecr.aws/q9t5s3a7/vllm-ci-test-repo:29431defe7282f70f66b035c3ecca26585bc2de5 "VLLM_TEST_SAME_HOST=0 torchrun --nnodes 2 --nproc-per-node=2 --rdzv_backend=c10d --rdzv_endpoint=192.168.10.10 distributed/test_same_node.py | grep 'Same node test passed' && VLLM_MULTI_NODE=1 pytest -v -s distributed/test_multi_node_assignment.py && VLLM_MULTI_NODE=1 pytest -v -s distributed/test_pipeline_parallel.py" "VLLM_TEST_SAME_HOST=0 torchrun --nnodes 2 --nproc-per-node=2 --rdzv_backend=c10d --rdzv_endpoint=192.168.10.10 distributed/test_same_node.py | grep 'Same node test passed'"

Weight Loading Multiple GPU Test - Large Models

Distributed Tests (A100)

LM Eval Large Models

TPU Testif [[ -f ".buildkite/run-tpu-test.sh" ]]; then bash .buildkite/run-tpu-test.sh; fi && yes | docker system prune -a

Ran in 13m 55s

Total Job Run Time: 1h 22m