Dragonfly R1 Versio - 搜索 News

资讯

最近的大语言模型（LLMs）如 OpenAI o1 和 DeepSeek-R1，已经在数学和编程等领域展示了相当强的推理能力。通过强化学习（RL），这些模型在提供答案 ...

英伟达新开源模型 Llama-Nemotron 震撼发布，推理性能超越 DeepSeek-R1

近日，英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron，该系列模型不仅在推能力上超越了 DeepSeek-R1，更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告，Llama-Nemotron 的训练过程与众不同，采用了合成数据监督微调与强化学习的方法 ...

36氪1月

142页长文揭秘DeepSeek-R1「思维大脑」，开启全新「思维链学」研究

DeepSeek-R1开源模型揭示思维链学与安全风险【导读】DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究 ...

站长之家2月

微软全新开源模型 MAI-DS-R1：敏感话题响应提升，安全风险降低

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上，进行了显著的增强，尤其在对敏感话题的响应能力上取得了巨大的突破。 MAI-DS-R1的响应能力达到了99.3%，是原版 R1的两倍多。这一进步将对政治学、社会问题 ...

虎嗅网2月

GPT-4.1淘汰了4.5：主打一个性价比，但仍不如DeepSeek R1

本文来自微信公众号：量子位，作者：鱼羊，题图来自：OpenAI 发布GPT-4.1，比GPT-4.5强的那种。新模型系列更新，一共带来三个版本：GPT-4.1，GPT-4.1 mini、GPT-4.1 nano。与通常中杯大杯超大杯的设置不同，这回翻译过来，是中杯、小杯、超小杯。 OpenAI表示，4.1系列是 ...

51CTO2月

UI-R1 | 仅136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

vivo 与香港中文大学的研究团队受到 DeepSeek-R1 的启发，首次将基于规则的强化学习（RL）应用到了 GUI 智能体领域。基于规则 ...

腾讯网3月

上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1 ...

Fin-R1仅7B参数，但在权威评测中，与参数量为671B的行业标杆DeepSeek-R1平均分差距仅3分，以75.2分的平均得分位居评测榜单第二。Fin-R1通过构建高质量 ...

GitHub3月

DeepSeek R1 满血版使用指南及7个可使用DeepSeek R1的网站推荐【2025年3月 ...

为了提升工作的效率与精准度，我整理并汇总了DeepSeek R1 满血版的使用指南以及推荐了7个适合使用该工具的网站，以供有需要的朋友们参考使用。 DeepSeek R1 满血版是一个高效的人工智能搜索引擎，专门为用户提供精准的信息检索服务。 DeepSeek最近一段时间由于 ...

36氪3月

全球首次，2B复现DeepSeek-R1“啊哈时刻”，UCLA等用纯RL实现多模态推理

由UCLA等机构共同组建的研究团队，全球首次在20亿参数非SFT模型上，成功实现了多模态推理的DeepSeek-R1「啊哈时刻」！就在刚刚，我们在未经监督 ...

中国教育和科研计算机网3月

兰大DeepSeek-R1，满血登场！！

课题组可通过高性能计算服务平台（https://hpc.lzu.edu.cn/)申请使用。超算中心目前已经部署了Deepseek-R1-1.5b 、7B、14b 、32b 、70b 等 ...

雷锋网4月

DeepSeek-R1 API 服务深度评测：火山引擎全面领先

导语：此次评测为开发者和企业用户提供了深度数据支撑，有助于其科学选择服务商，优化产品体验。 2月18日，国内领先的可观测与应用安全厂商 ...

GitHub4月

ollama本地部署671b满血版r1输出乱码 #440

启动ollama serve后得到的log如下： 2025/02/17 19:15:59 routes.go:1187: INFO server config env="map[CUDA_VISIBLE_DEVICES: GPU_DEVICE_ORDINAL: HIP_VISIBLE ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果