资讯

近日,由加州大学伯克利分校、麻省理工学院(MIT)和斯坦福大学的研究团队联合发布了一项名为"Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via ...
微软最近在其年度Build大会上发布Azure AI Foundry Agent Service的全面可用性(GA)版本,这是一个灵活的、与使用场景无关的平台,用于构建、部署和管理AI ...
在函数描述中嵌入使用标准是一个高级技巧,OpenAI提供了一个file_create函数的详细示例,展示了如何在描述中加入智能判断逻辑。这种做法把"主动性"控制逻辑从开发者提示中分离出来,让每个工具都有自己的使用智慧。
AIGC软件A股上市公司万兴科技旗下视频创意软件Wondershare Filmora携手微软加速突破智能视频创作的边界,以“自然语言驱动创作”重新定义智能剪辑交互方式,推进创意软件从“工具集成”向“智能协同”跃迁。
随着人工智能在多模态内容生成领域的持续突破,港中文MMLab团队近期发布的创新性模型T2I-R1成为行业关注的焦点。这一基于强化学习的推理增强文生图模型,不仅代表了AI技术革新的最新方向,更为多模态生成任务开启了全新的可能性。近年来,随着深度学习技术的不断深化,大规模视觉与语言模型(LMMs)在图像理解和生成方面取得了显著成就。OpenAI的DALL·E 3、Google的Imagen等代表性产品 ...
目前的大语言模型采用的是自回归方式,也就是一次预测一个词。虽然这种方法已经取得了令人印象深刻的成功,特别是在使用思维链 (Chain-of-Thought, CoT)提示时,模型能够生成连贯的推理步骤来解决复杂问题。但这种方法存在两个主要问题: ...
在人工智能飞速发展的今天,大型语言模型(LLMs)如GPT-4o、Gemini和Claude ...
近日,深圳北理莫斯科大学人工智能研究院2篇论文被国际人工智能领域顶级会议——第34届国际人工智能联合会议(International Joint Conference on Artificial ...
中证报中证网讯(记者 康曦)近日,微软Build 2025开发者大会在美国西雅图开幕,万兴科技旗下视频创意软件Wondershare Filmora作为大会主论坛合作伙伴亮相,为观众带来多项AI能力创新体验。通过深度集成微软最新Semantic Search(语义搜索)及knowledge retrieval(知识检索)API(应用程序编程接口),Wondershare ...
在年度Build大会上,微软宣布了Agent Loop,这是Azure Logic Apps引入的一个新功能,使开发人员能够将AI代理直接构建到他们的企业工作流中。 Agent Loop是Logic ...
香港科技大学的研究团队从人类用户构建工作流的方式中汲取灵感,提出了ComfyMind框架。他们观察到,人类用户通常不会从头开始构建复杂工作流,而是将任务分解为更小的子任务,并基于更高层次的语义为每个子任务选择适当的模板工作流。这种模块化、逐步规划的过 ...
当前具身智能研发正面临“双重枷锁”:一方面,真机验证成本高、仿真偏差大,制约策略验证效率;另一方面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,导致数据未被充分利用,制约了模型的持续进化。为打破这一困局,智元机器人在去年发布的机器人 4D ...