Branches - vllm-project/vllm - Morph

SIGN IN SIGN UP

vllm-project / vllm UNCLAIMED

A high-throughput and memory-efficient inference and serving engine for LLMs

74511 0 0 Python

BRANCHES

20 branches

main DEFAULT

claude/refactor-cmake-includes-XK2Xl

copilot/add-sp-min-token-to-e2e-tests

cursor/test-quality-improvements-eeea

fix-pixtral-lora

integrate-deepgemm-cmake

khluu/mig-small-model-swaps

lucas/sparse-indexer-logits-budget

luka/vllm-ir/rms-norm

releases/v0.18.1

vadim/qwen35-no-deppgemm

wentao-fix-qwen3.5-batch-invariant

wentao-optimize-async-scheduling-copy

wentao-remove-redundant-prompt-copy

wentao-skip-work-when-empty

wentao-sp-support-for-v2

woosuk/mrv2-expert-indices