2 7 3

BenfengXu

SpiketheCowboy

BenfengXu

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

MCP-AgentBench: Evaluating Real-World Language Agent Performance with MCP-Mediated Tools

upvoted a paper 3 months ago

Test-Time Scaling with Reflective Generative Model

upvoted a paper 4 months ago

From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding

View all activity

Organizations

upvoted a paper about 1 month ago

MCP-AgentBench: Evaluating Real-World Language Agent Performance with MCP-Mediated Tools

Paper • 2509.09734 • Published Sep 10 • 15

upvoted a paper 3 months ago

Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published Jul 2 • 106

upvoted 2 papers 4 months ago

From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding

Paper • 2506.03968 • Published Jun 4 • 15

DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents

Paper • 2506.11763 • Published Jun 13 • 70

liked a Space 5 months ago

107

DeepResearch Bench

🔍

Display a leaderboard for DeepResearch Bench

upvoted a paper 12 months ago

Parameter-Efficient Fine-Tuning of Large Language Models for Unit Test Generation: An Empirical Study

Paper • 2411.02462 • Published Nov 4, 2024 • 10

upvoted a paper over 1 year ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 166

authored a paper about 2 years ago

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 37

New activity in BAAI/COIG-PC-Lite about 2 years ago

从hf上load GOIC的数据集都会遇到这个问题

#1 opened over 2 years ago by

Kuaixueshiqing

upvoted a paper about 2 years ago

Scaling Relationship on Learning Mathematical Reasoning with Large Language Models

Paper • 2308.01825 • Published Aug 3, 2023 • 21

liked a Space over 2 years ago

ACL Pubcheck

📝

Check your PDF for ACL guidelines

New activity in tiiuae/falcon-7b over 2 years ago

Minimum requirements for inference

👍 1

#2 opened over 2 years ago by

bilelm

updated a Space over 2 years ago

Expertllama

📊

updated a model over 2 years ago

OFA-Sys/expertllama-7b-delta

Text Generation • Updated May 30, 2023 • 2 • 3

liked a model about 3 years ago

EleutherAI/gpt-neox-20b

Text Generation • 21B • Updated Jan 31, 2024 • 180k • 573