Publications

17 results at ACL 2026

LLMs are Brittle to Simple Code Transformations: Introducing CETBench – A Benchmark for Code-Equivalence Checking
- - Neeva Oza
  - Ishaan Govil
  - et al.
- 2026
- ACL 2026
Paper
A Survey on Evaluation of LLM-based Agents
- - Asaf Yehudai
  - Lilach Edelstein
  - et al.
- 2026
- ACL 2026
Paper
PO-KGQA: Preference Optimization for Low-Resource Complex Knowledge Graph Question Answering
- - Prerna Agarwal
  - Ayushman Singh
  - et al.
- 2026
- ACL 2026
Paper
STaD: Scaffolded Task Design for Identifying Compositional Skill Gaps in LLMs
- - Sungeun An
  - Swanand Ravindra Kadhe
  - et al.
- 2026
- ACL 2026
Paper
AutoForest: Automatically Generating Forest Plots from Biomedical Studies with End-to-End Evidence Extraction and Synthesis
- - Massimiliano Pronesti
  - Angelo Miculescu
  - et al.
- 2026
- ACL 2026
Demo paper
SemEval-2026 Task 7: Everyday Knowledge Across Diverse Languages and Cultures
- - Nedjma Ousidhoum
  - Junho Myung
  - et al.
- 2026
- ACL 2026
Workshop paper
SemEval-2026 Task 8: MTRAGEval: Evaluating Multi-Turn RAG Conversations
- - Sara Rosenthal
  - Yannis Katsis
  - et al.
- 2026
- ACL 2026
Workshop