资讯

最近的大语言模型(LLMs)如 OpenAI o1 和 DeepSeek-R1,已经在数学和编程等领域展示了相当强的推理能力。通过强化学习(RL),这些模型在提供答案 ...
近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告,Llama-Nemotron 的训练过程与众不同,采用了合成数据监督微调与强化学习的方法 ...
DeepSeek-R1开源模型揭示思维链学与安全风险 【导读】DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究 ...
微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。 MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题 ...
本文来自微信公众号:量子位,作者:鱼羊,题图来自:OpenAI 发布GPT-4.1,比GPT-4.5强的那种。 新模型系列更新,一共带来三个版本:GPT-4.1,GPT-4.1 mini、GPT-4.1 nano。 与通常中杯大杯超大杯的设置不同,这回翻译过来,是中杯、小杯、超小杯。 OpenAI表示,4.1系列是 ...
vivo 与香港中文大学的研究团队受到 DeepSeek-R1 的启发,首次将基于规则的强化学习(RL)应用到了 GUI 智能体领域。 基于规则 ...
Fin-R1仅7B参数,但在权威评测中,与参数量为671B的行业标杆DeepSeek-R1平均分差距仅3分,以75.2分的平均得分位居评测榜单第二。Fin-R1通过构建高质量 ...
为了提升工作的效率与精准度,我整理并汇总了DeepSeek R1 满血版的使用指南以及推荐了7个适合使用该工具的网站,以供有需要的朋友们参考使用。 DeepSeek R1 满血版是一个高效的人工智能搜索引擎,专门为用户提供精准的信息检索服务。 DeepSeek最近一段时间由于 ...
由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」! 就在刚刚,我们在未经监督 ...
课题组可通过高性能计算服务平台(https://hpc.lzu.edu.cn/)申请使用。超算中心目前已经部署了Deepseek-R1-1.5b 、7B、14b 、32b 、70b 等 ...
导语:此次评测为开发者和企业用户提供了深度数据支撑,有助于其科学选择服务商,优化产品体验。 2月18日,国内领先的可观测与应用安全厂商 ...
启动ollama serve后得到的log如下: 2025/02/17 19:15:59 routes.go:1187: INFO server config env="map[CUDA_VISIBLE_DEVICES: GPU_DEVICE_ORDINAL: HIP_VISIBLE ...