【[43星]ComplexFuncBench：复杂函数调用的终极-20250126140002（微信文章未删减版）

正文

2025-01-26 14:00
本条微博链接

【[43星]ComplexFuncBench：复杂函数调用的终极测试基准！它能解决复杂场景下函数调用的评估难题，帮助开发者优化模型性能。亮点：1. 包含1000个复杂函数调用样本，覆盖多步调用、参数推理等场景；2. 支持长参数（超500 tokens）和128k长文本上下文；3. 提供自动化评估框架，快速验证模型效果】
'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario'
GitHub: github.com/THUDM/ComplexFuncBench
#复杂函数调用# #AI评估# #长文本处理# #AI创造营#