Kv - 搜索 News

23 小时on MSN

焱融科技YRCloudFile：AI推理存储新突破，KV Cache特性引领高效算力时代

AI存储领域的创新者焱融科技近期宣布了一项重大技术进展，其自主研发的分布式文件存储系统YRCloudFile成功融入了大模型推理场景的关键特性——KV Cache功能。这一突破为AI推理效能带来了显著提升。 YRCloudFile的KV ...

腾讯网1 天

焱融YRCloudFile发布面向AI推理的分布式KV Cache特性

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！NEWS焱融新发布AI 存储厂商焱融科技宣布，其自主研发的分布式文件存储系统 ...

4 小时

揭秘老黄演讲中关键技术：PD分离，UCSD华人团队力作，LLM吞吐量跃升4倍

老黄GTC重点展示的PD分离技术为何成兵家必争之地？UCSD全华人团队力作，创新性地提出预填充-解码分离技术。在严格的延迟约束下，相比现有最先进的服务系统，可实现高达4.48倍的有效产出率或10.2倍更严格的SLO达成率。

1 天

焱融存储YRCloudFile发布面向AI推理的分布式KV Cache特性

AI 存储厂商焱融科技宣布，其自主研发的分布式文件存储系统 YRCloudFile 已成功支持大模型推理场景的 KV Cache 特性，为 AI 推理带来显著价值提升。 KV Cache 通过高效缓存机制加速数据读取，显著提升推理性能，突破 GPU 显存瓶颈，大幅提升推理 GPU 效率和并发处理能力。这意味着用户可以在不增加 GPU 资源的情况下，实现更高并发的推理请求，大幅降低 GPU ...

14 天

原创苏联KV-1是“美国现代坦克之母”？美国故意隐藏了1942年一段史实

苏联KV-1重型坦克是美国“现代坦克之母”？这个观点不是天方夜谭，二战后期的M26重型坦克和M24轻型坦克，不少关键技术都来自KV-1的启发。这两种坦克也是美国现代坦克的开端。

9 天

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。为应对这一难题，“hybrid model” ...

腾讯网7 天

为列宁格勒的KV系列坦克提供的燃料容器

因此，1941年7月底到8月初，开始出现配备了6到8个额外燃料箱的 KV-1 。这些坦克通常还配备了加厚的炮塔，分别来自伊治尔工厂和371工厂（列宁格勒机械制造厂）。这些燃料箱并非每辆K V坦克都有，部分坦克最初并未安装额外燃料箱。

IT168云计算·大数据频道 on MSN14 天

阿里云数据库Tair Serverless KV正式公测，可轻松应对流量波动

Tair Serverless KV以全托管、零运维的弹性能力重新定义了云原生数据库的服务边界。其灵活的CU动态调配与存储按需计费模式，不仅化解了传统数据库资源预配的浪费难题，更通过秒级弹性响应与多级容灾架构，为高波动业务提供了兼具成本效益与稳定性的技术底座。

什么值得买社区频道 on MSN35 分钟

用DeepSeek创收的“小公司”，痛并快乐着

AI Infra公司在宣布接入DeepSeek-R1后，会有很多中小企业前来联系，希望获得部署了R1模型的产品，清程极智就遇到了类似情形。“你们的D ...

2 小时

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

具体来讲，xLSTM 7B 模型基于 DCLM 数据集，使用 128 块 H100 GPU，在 8192 上下文长度下训练了 2.3 万亿 token。研究者对原始 xLSTM 架构进行了改进，确保训练效率和稳定性，同时保持任务性能。新架构依靠 ...

红板报 on MSN23 小时

英伟达发布Dynamo，向DeepSeek等中国开源生态致敬

DeepSeek挑起的模型价格战，冲击了市场对英伟达的信仰。黄仁勋的公开回击是，一边向DeepSeek、月之暗面与字节跳动等中国企业致敬，一边将其开源的优化思路，封装在自己的Dynamo中，促进创新的民主化。

16 天

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长 ...

最近，DeepSeek的NSA与月之暗面的MoBA让稀疏注意力机制受到了较大的关注，相较于上述工作采用固定token数来划分压缩区间，SepLLM根据原生语义来划分动态数量的token数。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果