资讯
为贯彻落实《国家数据标准体系建设指南》关于标准宣贯、先行先试和典型示范要求,金控集团所属北京国际大数据交易所正式推出全国首套数据交易系列标准贯标工具,首创“标准解读→技术实现→企业验证”的全链路贯标模式,覆盖区域性、行业性场景,为企业提供全链路贯标解 ...
家电影局指导、中影主办的 “中影·微光计划”系列活动在东莞理工学院举行。 GDC亚太区音频市场总监晁霞女士受邀参加「光影未来」主题论坛,与行业领军人物共同探讨了LED影厅技术革新与沉浸式观影体验的升级路径。晁总围绕影院声音系统的技术演进、成本优化方案及内容制作生态等议题展开深度分享,为行业破解技术升级与商业价值平衡难题提供了新思路。 解码影院声音技术图谱 晁总从技术分类、品牌格局及 ...
【导读】智源研究院发布开源模型Video-XL-2,显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化,支持单卡处理万帧视频,编码2048帧仅需12秒。 尽管OpenAI GPT-4o、Google ...
8 小时
证券日报网 on MSN联合光电:第四届监事会第4次临时会议决议公告证券日报网讯 6月3日晚间,联合光电发布公告称,公司第四届监事会第4次临时会议审议通过了《关于公司发行股份购买资产并募集配套资金暨关联交易符合相关法律法规规定条件的议案》等。 (编辑 姚尧) ...
在能耗焦虑蔓延的当下,创维A6F Pro以一级能效标准交出满分答卷。实测数据显示,相比普通电视,其年耗电量可减少约30%。更令人心动的是,现在购买可享政府节能补贴至高减500元,相当于用中端机的预算,就能把旗舰级画质抱回家。
19 小时
科技行者 on MSNHoPE:视觉语言模型中的混合位置编码技术让AI更懂长视频当我们使用ChatGPT这类大型语言模型讨论一张图片或视频时,你是否好奇它如何理解内容的时间和空间关系?比如,当你问"视频中哪一秒出现了小猫",AI需要准确理解视频的时间线和画面中的物体位置。然而,现有的视觉语言模型在处理长视频时表现不佳,特别是超过 ...
长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google ...
机器之心发布机器之心编辑部长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini ...
15 小时on MSN
智源研究院携手上海交通大学等科研机构,近期震撼发布了Video-XL-2,一款专为超长视频理解设计的新一代模型。这一创新成果标志着长视频理解技术在开源领域迈入了一个全新的里程碑,为多模态大模型在视频内容深度解析的道路上铺设了坚实的基石。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果