资讯

2025年4月19日,来自金融界的最新消息震撼业界:北京岩烁科技有限公司获得了一项名为‘一种基于DDPG的空中安全数据采集及资源分配方法’的专利,授权公告号为CN117058929B。这标志着公司在高科技领域的重要突破,为无人机和空中安全管理等行业的资源优化与 ...
最近,北京的一场人形机器人半程马拉松,吸引了巨大关注量。人形机器人再次成为了讨论的焦点。 然而,这场马拉松比赛的热度还没过去,另一场更为硬核的比赛已经在酝酿。2025 年 5 月至 6 月,宇树科技将举办全球首场“人形机器人格斗大赛”。这个曾经只 ...
RL可通过模拟训练,学习避免碰撞并优化路径规划。例如,使用深度确定性策略梯度(DDPG)算法,将手术工具末端位置误差作为奖励信号,实现动态避障。 康复机器人 下肢外骨骼机器人需根据患者步态实时调整支撑力。RL可通过患者肌电信号(EMG)与运动学数据 ...
为了评估RAD优化器的性能,研究者在5种主流深度强化学习(DRL)算法(包括DQN、DDPG、TD3、SAC和ADP)和12个测试环境(包括1个CartPole任务、6个MuJoCo ...