Xuanjing Huang's picture

Xuanjing Huang

xjhuang

·

AI & ML interests

None yet

Organizations

authored a paper 6 months ago

Pre-Trained Policy Discriminators are General Reward Models

Paper • 2507.05197 • Published Jul 7, 2025 • 39

authored 2 papers 8 months ago

WorldPM: Scaling Human Preference Modeling

Paper • 2505.10527 • Published May 15, 2025 • 34

A Multi-Dimensional Constraint Framework for Evaluating and Improving Instruction Following in Large Language Models

Paper • 2505.07591 • Published May 12, 2025 • 11