Jump to content

⚡

Fastcheck

Public

Fast CI for PRs

Queue Paused

Kevin Luu•yesterday at 6:51 PM

Merge branch 'main' into minicpm-cleanup

#17957

/

DarkLight1337:minicpm-cleanup/aabed82d5(#15337)

Failed in 2h 31m

Run Neuron Test

Documentation Build

Basic Correctness Test

Entrypoints Test

Run Async Engine, Inputs, Utils, Worker Test

Async Engine, Inputs, Utils, Worker Test

Run Python-only Installation Test

Python-only Installation Test

Run Chunked Prefill Test

Chunked Prefill Test

Run Distributed Tests (4 GPUs)

Distributed Tests (4 GPUs)

Run Metrics, Tracing Test

Metrics, Tracing Test

Run Regression Test

Regression Test

Run Engine Test

Run V1 Test

Run Examples Test

Run Prefix Caching Test

Prefix Caching Test

Run Samplers Test

Run LogitsProcessor Test

LogitsProcessor Test

Run Speculative decoding tests

Speculative decoding tests

Run LoRA Test %N

Run PyTorch Fullgraph Smoke Test

PyTorch Fullgraph Smoke Test

Run PyTorch Fullgraph Test

PyTorch Fullgraph Test

Run Kernels Test %N

Run Tensorizer Test

Tensorizer Test

Run Benchmarks

Run Quantization Test

Quantization Test

Run LM Eval Small Models

LM Eval Small Models

Run OpenAI API correctness

OpenAI API correctness

Run Encoder Decoder tests

Encoder Decoder tests

Run OpenAI-Compatible Tool Use

OpenAI-Compatible Tool Use

Run Basic Models Test

Basic Models Test

Run Language Models Test (Standard)

Language Models Test (Standard)

Run Language Models Test (Extended)

Language Models Test (Extended)

Run Multi-Modal Models Test (Standard)

Multi-Modal Models Test (Standard)

Run Multi-Modal Models Test (Extended) 1

Multi-Modal Models Test (Extended) 1

Run Multi-Modal Models Test (Extended) 2

Multi-Modal Models Test (Extended) 2

Run Custom Models Test

Custom Models Test

Run Distributed Comm Ops Test

Distributed Comm Ops Test

Run Distributed Tests (2 GPUs)

Distributed Tests (2 GPUs)

Run Plugin Tests (2 GPUs)

Plugin Tests (2 GPUs)

Run Multi-step Tests (4 GPUs)

Multi-step Tests (4 GPUs)

Run Pipeline Parallelism Test

Pipeline Parallelism Test

Run LoRA TP Test (Distributed)

LoRA TP Test (Distributed)

Run Weight Loading Multiple GPU Test

Weight Loading Multiple GPU Test

Run 2 Node Tests (4 GPUs in total)

2 Node Tests (4 GPUs in total)

Run A100 tests

Weight Loading Multiple GPU Test - Large Models

Distributed Tests (A100)

LM Eval Large Models

Run TPU V0 Test

Run TPU V1 Test

Run GH200 Test

Cyrus Leung

Created Mon 24th Mar at 4:00 AM

Triggered from Webhook

Multi-Modal Models Test (Extended) 2

Ran in 41m 43s

Total Job Run Time: 6h 22m