Publications

5 results for Junchen Jiang

When to Reason: Semantic Router for vLLM
- - Chen Wang
  - Xunzhuo Liu
  - et al.
- 2025
- NeurIPS 2025
Workshop paper
Networking for Stateful LLM Inference
- - Junchen Jiang
  - Yuhan Liu
  - et al.
- 2025
- SIGCOMM 2025
Tutorial
Scalable and Efficient LLM Serving with the vLLM Production Stack
- - Junchen Jiang
  - Yue Zhu
- 2025
- OSSNA 2025
Talk
Towards Optimal Preemptive GPU Time-Sharing for Edge Model Serving
- - Zhengxu Xia
  - Yitian Hao
  - et al.
- 2023
- MIDDLEWARE 2023
Workshop paper
DEFT: SLO-Driven Preemptive Scheduling for Containerized DNN Serving
- - Yitian Hao
  - Wenqing Wu
  - et al.
- 2023
- NSDI 2023
Poster