Publications

5 results for Xiangliang Zhang

ProbeLLM: Automating Principled Diagnosis of LLM Failures
- - Yue Huang
  - Zhengzhe Jiang
  - et al.
- 2026
- ICML 2026
Conference paper
Capability-Oriented Training Induced Alignment Risk
- - Yujun Zhou
  - Yue Huang
  - et al.
- 2026
- ICML 2026
Conference paper
Towards Trustworthy and Socially Responsible Generative Foundation Models
- - Yue Huang
  - Zhenhong Zhou
  - et al.
- 2026
- AAAI 2026
Tutorial
BenchmarkCards: Standardized Documentation for Large Language Model Benchmarks
- - Anna Sokol
  - Elizabeth Daly
  - et al.
- 2025
- NeurIPS 2025
Conference paper
Adaptive Distraction: Probing LLM Contextual Robustness with Automated Tree Search
- - Yanbo Wang
  - Zixiang Xu
  - et al.
- 2025
- NeurIPS 2025
Conference paper