资讯

这项由上海交通大学和字节跳动公司联合研究团队开发的MagiCodec(Masked Gaussian-Injected Codec)研究成果发表于2025年5月31日的arXiv预印本平台(arXiv:2506.00385v1)。该研究由Yakun ...
C114讯 6月5日消息(南山)近日,在上海举办的《麻省理工科技评论》2024年度“35岁以下科技创新35人”中国区发布暨中国科技青年论坛上,新一届入选者正式揭晓。3位量子学者入选该榜单。
研究团队通过在不同模态的任务中采用范围从 2000 到 100 万 tokens 的大块更新打造了这种新模型架构。该架构集成了用于捕捉长上下文的大块测试时训练,并集成了用于针对局部结构进行建模的窗口注意力机制。
新智元报道 编辑:KingHZ【新智元导读】原生1bit大模型BitNet b1.58 2B4T再升级!微软公布BitNet v2,性能几乎0损失,而占用内存和计算成本显著降低。最近,微软亚研院的研究团队开源了原生1bit精度的大模型:BitNet ...