Publications

46 results at AAAI 2026

ToolSmith: A Multi-Agent Framework for Enterprise Tool Creation
- - Purna Chandra Sekhar Vakudavathu
  - Kushal Mukherjee
  - et al.
- 2026
- AAAI 2026
Demo paper
AutoTuneX: Interactive Automated Fine-Tuning for Large Language Models
- - Daniel Karl I. Weidele
  - Priyanshu Rai
  - et al.
- 2026
- AAAI 2026
Demo paper
QueryGym: Step-by-Step Interaction with Relational Databases
- - Haritha Ananthakrishnan
  - Harsha Kokel
  - et al.
- 2026
- AAAI 2026
Demo paper
AssetOpsBench-Live: Privacy-Aware Online Evaluation of Multi-Agent Performance in Industrial Operations
- - Dhaval Patel
  - Nianjun Zhou
  - et al.
- 2026
- AAAI 2026
Demo paper
CLEAR: Error Analysis via LLM-as-a-Judge Made Easy
- - Asaf Yehudai
  - Lilach Edelstein
  - et al.
- 2026
- AAAI 2026
Demo paper
Risk Atlas Nexus: A System for Managing AI Risks
- - Inge Vejsbjerg
  - Rahul Nair
  - et al.
- 2026
- AAAI 2026
Demo paper
DFAgent: From Natural Language Data Interactions to Reusable Agent-Ready Tools
- - Neelamadhav Gantayat
  - Renuka Sindhgatta
  - et al.
- 2026
- AAAI 2026
Demo paper
Auto-BenchmarkCard: Automated Synthesis of Benchmark Documentation
- - Aris Hofmann
  - Inge Vejsbjerg
  - et al.
- 2026
- AAAI 2026
Demo paper
Agentic Code Generation for Heuristic Rules in Equipment Monitoring
- - Fabio Lorenzi
  - Abigail Langbridge
  - et al.
- 2026
- AAAI 2026
Workshop paper
Black-Box Uncertainty Quantification for Large Language Models via Ensemble-of-Ensembles
- - Wang Ma
  - Debarun Bhattacharjya
  - et al.
- 2026
- AAAI 2026
Workshop paper