该论文提出了一种名为模型对齐搜索(MAS)的因果方法,通过学习线性变换并在模型之间进行因果干预,揭示了神经表征之间的相似性,并提出了能够适用于因果不可访问模型的 CMAS 方法,证明了其在分析神经表示方面的优越性和广泛的应用潜力。 [LG]《Model Alignment Search》S Grant [Stanford University] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#