资讯

在大型语言模型(LLMs)迅速发展的今天,一项来自EPFL(瑞士联邦理工学院洛桑分校)、东北大学和微软联合研究团队的创新成果正在改变我们对模型效率的认识。这篇名为"zip2zip: 通过令牌压缩实现大语言模型的推理时自适应词汇表"的研究由Saibo ...