【LLM-as-an-Interviewer:一个通过模拟面试过程来评估大型语言模型(LLMs)能力的框架,让一个LLM扮演面试官的角色,通过提供反馈和追问问题来全面评估其他LLMs的能力】'LLM-as-an-Interviewer: Beyond Static Testing Through Dynamic LLM Evaluation' GitHub: github.com/interview-eval/interview-eval #人工智能# #语言模型评估# #动态测试# #AI创造营#