贝叶斯 - 搜索 News

资讯

12 小时

首次解释LLM如何推理反思！新框架引入贝叶斯自适应强化学习

本文一作张申傲是美国西北大学二年级博士生，研究方向涵盖大语言模型与强化学习，尤其关注LLM的对齐，推理，以及智能体。其研究旨在构建能够主动获取信息并自我提升以实现超越人类水平的智能系统。

2 天

贝叶斯主义：人类最最最理性的思维方式！！！

贝叶斯定理描述了在已知先验概率的情况下，如何利用新证据来更新信念。贝叶斯的决策思维，正是源自这一核心理念。它是一种基于概率推理的决策方法，其核心是利用贝叶斯定理来更新概率分布，从而做出最优决策。

腾讯网15 小时

BayesFlow：基于神经网络的摊销贝叶斯推断框架

贝叶斯推断为不确定性条件下的推理、复杂系统建模以及基于观测数据的预测提供了严谨且功能强大的理论框架。尽管贝叶斯建模在理论上具有优雅性，但在实际应用中经常面临显著的计算挑战：后验分布通常缺乏解析解，模型验证和比较需要进行重复的推断计算，基于仿真的工作流程（如校准、参数恢复、敏感性分析）的计算复杂度极高。这些计算瓶颈长期制约着贝叶斯工作流程的实际部署，直到 BayesFlow ...

12 小时

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应 ...

对此，西北大学与Google、谷歌DeepMind团队质疑了传统强化学习与反思的关系，并提出了贝叶斯自适应的强化学习方法，首次解释了为什么、如何、以及何时应该反思并探索新策略。事实上，现有的基于马尔可夫假设的强化学习范式存在天然的局限——探索（exploration）仅发生在训练阶段，代理在部署（测试）时通常只会利用（exploit）训练中学到的确定性策略。

腾讯网3 天

超越马尔可夫：贝叶斯自适应强化学习让大语言模型反思性探索更高效

首先，马尔可夫策略的最优性可以通过简单记忆训练解决方案实现。由于探索仅限于训练阶段，系统能够通过反复试错发现回报最大化的行动序列，并在测试时完全利用这些记忆的解决方案。这就像你在考试前反复练习标准题目，考试时直接套用记忆的解法，而不是实时思考和适应。

生物通2 天

基于贝叶斯系统地理学解析大豆花叶病毒(SMV)的起源与全球传播 ...

本研究通过贝叶斯系统地理学分析350余个大豆花叶病毒(SMV)外壳蛋白(CP)基因序列，首次揭示SMV可能于16世纪起源于韩国，其 ...

生物通2 天

贝叶斯深度学习结构光照明显微镜实现带不确定性量化的可靠超 ...

为解决传统深度学习结构光照明显微镜（DL-SIM）透明性与可靠性不足、易致生物误判问题，研究人员开发贝叶斯深度学习（BayesDL）框架用于 SIM。结果表明其可提升重建保真度并量化超分辨率不确定性，为实际应用奠定基础。在生命科学研究的微观世界探索中 ...

51CTO6 天

高手做决策的认知公式：贝叶斯定理及其三重境界

贝叶斯定理描述了在已知先验概率的情况下，如何利用新证据来更新信念。贝叶斯的决策思维，正是源自这一核心理念。它是一种基于概率推理的决策方法，其核心是利用贝叶斯定理来更新概率分布，从而做出最优决策。 “顶级的成功不是因为他们是谁 ...

1 天

美媒：顶尖人才正弃美国而去

这不仅仅是美国科学界失去权力或声望的问题。科学家们认为，一些长期以来推动美国科研引擎发展的国际人才可能会流向其他地方。从法国到澳大利亚，许多外国政府都开始公开向美国科学家示好。（编译/林朝晖王笛青） ...

人人都是产品经理 on MSN3 天

设计思维失效了吗？如何做变革设计？

刚开始入行产品经理，就被培训设计思维（Design Thinking）的方法论，这么多年来，设计思维好像是产品工作的万金油，但是，站在变革的视角，设计思维其实还有很多问题。为什么要做变革设计？直面商业的复杂和未知 ...

腾讯网2 天

詹庆元教授团队在《Thorax》发文：确定ARDS纵向氧合亚型，为诊治带来 ...

2025年5月19日，中日友好医院詹庆元教授团队在Thorax（中国科学院一区，IF=10.8）发表研究论文，“Dynamic oxygenation subgroup bringing new insights in ARDS: more ...

凤凰网陕西频道3 天

智驭金融：AI引领金融行业新变革主题沙龙圆满落幕

随后，西北大学经济管理学院金融系副主任王峰虎带来《AI+金融前沿进展：挑战与应对》主旨演讲。剖析了AI+金融通过核心技术提升金融服务效率、智能化水平和安全性，涵盖风险管理、算法交易、客户服务等前沿进展，分析市场规模与产业重构，探讨技术瓶颈、监管困境及 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果