资讯

C114讯 6月5日消息(南山)近日,在上海举办的《麻省理工科技评论》2024年度“35岁以下科技创新35人”中国区发布暨中国科技青年论坛上,新一届入选者正式揭晓。3位量子学者入选该榜单。
研究团队通过在不同模态的任务中采用范围从 2000 到 100 万 tokens 的大块更新打造了这种新模型架构。该架构集成了用于捕捉长上下文的大块测试时训练,并集成了用于针对局部结构进行建模的窗口注意力机制。
新智元报道 编辑:KingHZ【新智元导读】原生1bit大模型BitNet b1.58 2B4T再升级!微软公布BitNet v2,性能几乎0损失,而占用内存和计算成本显著降低。最近,微软亚研院的研究团队开源了原生1bit精度的大模型:BitNet ...