省一半算力跑出2倍效果,月之暗面开源优化器Muon,同预算下全面领先。 月之暗面和 DeepSeek 这次又「撞车」了。 上次是论文,两家几乎前后脚放出改进版的注意力机制,可参考《撞车 DeepSeek NSA,Kimi 杨植麟署名的新注意力架构 MoBA 发布,代码也公开》、《刚刚 ...
GitHub 有个功能,可以往过去的时间提交代码,比如我发现2012年刚注册 GitHub 的时候,只有两天提交了代码,可以说是毫无战绩可言了。 在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.png ...
距离上次写 release notes 已过了近三个月,在此期间 XHTTP 积累了大量的改进与修复,其中感知最明显的是逐步将 HTTP request header 的 path padding 迁移至了 Referer header 以避免产生过长的日志(由 @rPDmYQ提出),以及逐步修复了 stream-up 通过 CF 时连接 100 秒后被掐断的 ...