资讯

为了探索这个问题,研究团队设计了一个巧妙的实验框架。想象一下,如果我们可以精确控制红队测试者和目标模型的能力水平,那么我们就可以系统地研究能力差距如何影响测试效果。但在现实中,我们无法随意调整人类的能力。研究人员的解决方案是:使用不同能力水平的语言模 ...