Farima Fatahi 's picture

Farima Fatahi

farimafatahi

·

farimafatahi

AI & ML interests

None yet

Recent Activity

authored a paper 22 days ago

FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation

authored a paper 22 days ago

Logit Arithmetic Elicits Long Reasoning Capabilities Without Training

authored a paper 22 days ago

From Proof to Program: Characterizing Tool-Induced Reasoning Hallucinations in Large Language Models

View all activity

Organizations

authored 3 papers 22 days ago

FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation

Paper • 2410.22257 • Published Oct 29, 2024

Logit Arithmetic Elicits Long Reasoning Capabilities Without Training

Paper • 2507.12759 • Published Jul 17

From Proof to Program: Characterizing Tool-Induced Reasoning Hallucinations in Large Language Models

Paper • 2511.10899 • Published 27 days ago • 3