EN

世界杯直播

世界杯直播

2026世界杯(中国) 腾讯混元3幕后:重构架构,姚顺雨一场非典型的「逆袭」

发布日期:2026-05-15 05:54 来源:未知 作者:admin 浏览次数:

2026世界杯(中国) 腾讯混元3幕后:重构架构,姚顺雨一场非典型的「逆袭」

早在三月,拿腾飞速要上线的混元 3.0,在腾讯混元责任的同学左飞就对雷峰网说过:"此次混元的新版块,其实团队预期不算太高。"

一个月后,4 月 23 日晚,Hy3 的 Preview 版块认真发布,同步开源,向寰宇展示我方最真确的神情。雷峰网独家获悉,Hy3 边界更大、功能更全面的闭源旗舰版块将在五六月份发布,给东谈主留住不少念念象空间。

(腾讯混元的新推崇,雷峰网正在捏续照应,宽饶添加作家微信:william_dong,相通信息,商量理会。)

提及来,腾讯 Hy3 Preview 的发布也有点"时运不济"——前有 GPT 5.5 举世围不雅,后有 DeepSeek V4 重磅牵记,被夹在中间的混元,仍是在" 9.7 减去 9.11 "的小学数学题上犯了难,在应酬平台上引起了一阵围不雅。

"其实 GPT 和 DeepSeek 的发布日历在咱们里面也不是什么奥妙,但为什么经受在这个时间和他们一皆发布,我也不太了了。"左飞对雷峰网如是说

Hy3 之于 4 个月前的上一个版块究竟有哪些变化?在混元里面的同学邰萝对雷峰网共享谈:" Hy3 基本上把之前的架构重构了一遍,但通俗来来说,是回到了‘基本’。"

一直以来,业界的"基本",是使用 Transformer 架构和 Full Attention 等一系列被考据了的本领决策,如 OpenAI 奉行的相通,华游体育中国官网入口少有花里胡梢的操作,中枢是把 DATA 作念到极致;

而 Hy2 的时期,腾讯却尝试了不少架构上的革命——比如 Multi-Token Prediction、Mamba 等决策,反而把数据和 Infra 的"基础题"放下了。

到了 Hy3,姚顺雨则主导模子回到"基本",再应用用进程考据的共鸣架构。而畴前没绕过,今天也不成能绕过的数据和 Infra 问题,则成了必须下足的"苦功夫"。

开运中国官方网站

腾讯同学雷瓯对雷峰网说,在畴前,不少 SFT 数据莫得进程去重,叠加、冗余的数据以致能达到上千万条,尤其是工期病笃的时间,数据的优先级就被排在了很背面。

姚顺雨来到腾讯,2026世界杯官方指定中国区认证平台拉起了一个 20 余东谈主的预检会数据团队,特意作念数据审核"最脏最累"的责任,几个月内把冗余的 SFT 数据放肆在了一万多条的边界下。

而在 Infra 的角度,姚顺雨也拎起了一个团队,重构畴前腾讯 RL 的管线,让万卡集群莽撞跑得知道、安全,有应酬突发情况的才调。

之前,在腾讯 TEG,里面使用的基础面容是一个名叫"太极"的机器学习平台。近期,太极平台的 Feature 也在以一到两周一次的速率进行更新,作念了不少迭代责任。

于是,在腾讯里面的 Benchmark 上,混元的性能不错达到 Kimi 2.5 的水平,稀零了 MiniMax,仅次于 Gemini 和 Seed 2.0。

在混元体系的改良中,姚顺雨上演的变装不仅是一个本领魁首:除了数据和 Infra 进行了无数重构,混元的组织和东谈主员也完成了不小的挽救。

组织上,混元被分为了预检会、后检会、Baseline Infra、模子评估和 Frontier 五大板块,除 Frontier 更偏本领探索和预研除外,四个板块十几个组,以十分扁平的结构,果真全部插足 Hy3 的研发当中,而姚顺雨也被评价为十分亲历亲为的指导变装,对本领细节颠倒照应,和底下同学一皆开会时间不少;

东谈主员上,姚顺雨入主之后,也在推进团队的重构,从字节、阿里、DeepSeek、Kimi 等部接纳无数中枢东谈主才,姚顺雨尤其心爱信仰 AGI、本领塌实的年青东谈主,不少校招生、实习生也加入团队,给团队注入了不少崭新血液。

如今的姚顺雨,面对的并非与行业巨头旗饱读颠倒的正面交锋,而是一场从底层补短板、填过失的追逐之战——腾讯的逆袭绝非一蹴而就,只有千里下心打磨基本功,方能积存力量奋发蹈厉,重回竞逐的第一梯队。

(腾讯等大厂在 AI 赛谈上的竞逐2026世界杯(中国),背后内幕不少,雷峰网正捏续深度造访,宽饶添加作家微信:william_dong   了解更多音信。)