【[43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解决复杂场景下函数调用的评估难题,帮助开发者优化模型性能。亮点:1. 包含1000个复杂函数调用样本,覆盖多步调用、参数推理等场景;2. 支持长参数(超500 tokens)和128k长文本上下文;3. 提供自动化评估框架,快速验证模型效果】
'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario'
GitHub: github.com/THUDM/ComplexFuncBench
#复杂函数调用# #AI评估# #长文本处理# #AI创造营#
'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario'
GitHub: github.com/THUDM/ComplexFuncBench
#复杂函数调用# #AI评估# #长文本处理# #AI创造营#