Publications

4 results for Jan van Lunteren

Portable High‑Performance LLM Serving: A Triton Backend for vLLM
- - Burkhard Ringlein
  - Jan van Lunteren
- 2026
- PyTorchEU 2026
Talk
vllm-triton-backend: How to get state-of-the-art performance on NVIDIA and AMD with just triton
- - Burkhard Ringlein
  - Thomas Parnell
  - et al.
- 2025
- PyTorch Conference 2025
Talk
The Anatomy of a Triton Attention Backend
- - Burkhard Ringlein
  - Jan van Lunteren
  - et al.
- 2025
- Triton Developer Conference 2025
Poster
Accelerating Decision-Tree-based Inference through Adaptive Parallelization
- - Jan van Lunteren
- 2023
- PACT 2023
Conference paper