首页新闻时事

腾讯七年磨一芯

小新正三品 (侍郎) 2026-05-29 08:12 23 0 返回新闻时事

小

小新正三品 (侍郎) 楼主

2026-05-29 08:12

第1楼

AI摘要：（文/陈济深编辑/张广凯）

5月26日，腾讯赢了一场和英伟达、AMD、英特尔同台的比赛。

三年后的2022年3月，沧海V1顺利点亮；2023年进入量产。五年后，整个行业的同一笔账，会被一位UP主用另一种方式摆到大众面前。

2024年10月，UP主"影视飓风"发了一条名为《清晰度不如4年前！

（文/陈济深编辑/张广凯）

5月26日，腾讯赢了一场和英伟达、AMD、英特尔同台的比赛。

作为一项办了20多年的权威评测，莫斯科国立大学（MSU）的视频编码比赛与谷歌、英特尔、英伟达、AMD等芯片大厂保持评测合作或长期往来，是该领域少数被业界公认的"裁判席"，业内把它视作硬件视频编码的"奥林匹克"。

今年的硬件视频编码比赛有41款硬件编码器参赛，覆盖H.264、H.265、AV1、H.266全部主流标准。

腾讯自研编解码系列芯片"沧海"，在30fps、60fps、120fps、240fps四个速度档位、所有评测指标（SSIM、PSNR、VMAF）里全部第一，多项指标领先超30%。

MSU 2026硬件视频编码比赛榜单，腾讯沧海V2/V1包揽多档第一

但比这次冠军本身更值得问的是：腾讯这颗自研芯片，是怎么出现的？

一笔成本账，逼出一颗芯

故事的起点，要回到七年前。

2019年的腾讯，视频业务已经不只是腾讯视频和直播。微信视频号正在准备阶段，云游戏开始浮现，对外提供服务的腾讯云媒体处理MPS也已经在线运营。

这些业务每天都在生成同一个问题：一帧画面，从被上传、转码、存储到分发到用户手机上，每一步都在花钱。

视频行业最重的成本，从来不在视频制作上，而在基建，也就是每一帧画面抵达用户之前的那条链路里。解码、分析、增强、编码、存储以及分发等，任何一个环节多出来一点点成本，乘以微信视频号、腾讯视频、QQ、直播和云游戏这套体量，都会变成一张很长的账单。

这张账单过去的解法，往往是通过堆量采购更多服务器、租更多CDN节点来摊平。

但当业务规模大到一定量级，这种摊成本的方法也会开始失效。再多的通用服务器，也不如一颗为视频专门设计的芯片省钱。

腾讯做了一个判断：自己造一颗。

那一年，"沧海"项目正式立项。三年后的2022年3月，沧海V1顺利点亮；2023年进入量产。

如果说通用芯片追求的是尽可能适配更多场景，专用芯片追求的就是在一个确定场景里把效率抠到极致。前者解决"能不能做"，后者解决"值不值得这样做"。沧海诞生的使命，显然是后者。

对腾讯来说，视频就是那个最值得做专用芯片的场景：它确定、高频，也足够昂贵。

这套逻辑，腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生后来在2021年的腾讯数字生态大会上有过更直接的表述：腾讯造芯，"是需求驱动，基于自身存在需要解决的问题"。

五年后，整个行业的同一笔账，会被一位UP主用另一种方式摆到大众面前。

2024年10月，UP主"影视飓风"发了一条名为《清晰度不如4年前！视频变糊是你的错觉吗？》的视频，直指各大视频平台过度压缩视频：名义上的4K不如四年前的1080P清晰。

视频上线后引起广泛讨论，但留下了一个外界很少正面回应的问题：视频平台为什么要偷偷降画质？

答案不浪漫，还是那个字：钱。

翻开爱奇艺的财报：2020年全年带宽费用24亿元，即便想尽办法压缩成本，到2023年Q2，一个季度就要4.5亿元。

腾讯没有选"偷偷压画质"这条路，它选了更慢、更重、也更彻底的一条：把账本反过来写进硬件，也就是沧海的架构。

腾讯把这套思路概括为"全链路软硬件协同"。更直白地说，就是不只靠芯片本身硬算，而是把码率控制、内容预分析、候选编码模式、画质判断和硬件架构一起优化。

视频里哪些画面该多分码率，哪些画面可以少分，哪些场景容易糊，哪些运动画面最吃编码器，这些问题只有在真实业务里长期跑，才会形成足够细的经验。

这不是把一颗芯片塞进数据中心，而是把数据中心的经验，一刀一刀刻进硅里。

数据中心里的"老员工"

2023年沧海V1量产。到2026年的今天，按腾讯云披露的数据，沧海芯片在腾讯云及腾讯自有场景中已经部署超过10万片，覆盖直播点播、4K转码、云游戏等业务。

"超过10万片"是个什么概念？

公开数据显示，沧海单颗芯片编完一帧1080p视频只要4毫秒。10万片这种密度堆在一起，等于把一座大型转码机房，压进了一组组机柜里。

对芯片产业来说，"超过10万片"比"拿下比赛第一"更有分量。

比赛证明的是峰值能力，部署规模证明的是经济性。视频编解码芯片不是实验室里的参数游戏，它必须在数据中心里长期跑，要能把每一项成本真的压下去，还要能被云产品和内部业务调度起来。

否则，压缩率再漂亮，也只是工程样机里的奖杯，不会真的省下一分钱。

腾讯也公开过一项技术指标：在120fps的高帧率档位上，同等画质下，沧海比行业领先ASIC还能再节省10%的码率。这个10%，听起来不大。但当流量以 Tb 计算，每个百分点就是数以亿计的 CDN 流量成本。

MSU比赛上拿下240fps极速档全指标冠军的这颗V1，正是每天在腾讯视频和腾讯云数据中心里跑着的"老员工"。

沧海的价值，从来不在于"腾讯也能造芯"。它在于：沧海是先有场景、再有芯片的产物。这样长出来的芯片，从一开始就跑在能直接服务业务的轨道上。

这条路上，腾讯不是孤例。

大洋两岸，殊途同归

早在2015年前后，Google工程师就发现了一个让人头大的问题：YouTube用户上传的视频需要被转成8到15种规格分发，转码集群消耗的服务器数量大到惊人。

Google给出的答案，叫Argos VCU。

2021年，Google在ASPLOS大会上公开了第二代Argos——一颗专为YouTube转码而生的视频编码芯片，效率比传统服务器高出20到33倍，把原本要花几天才能跑完的4K视频转码压到几小时。

往更大的格局看，亚马逊从2015年开始的Nitro，到2018年的Graviton，再到2022年的Trainium，一路把云业务里每个高频环节都做成自研芯片。截至2024年中，AWS新增CPU容量里有一半已经跑在自研Graviton上。

国内的同一道题也不止腾讯一家在解。2023年，字节跳动旗下火山引擎也披露了自研视频编解码芯片，主要服务于抖音和西瓜视频。不同公司、不同业务，但路径出奇地一致。

视频之外，这条逻辑同样在AI算力栈里上演。

今年4月，DeepSeek-V4发布后，华为宣布升腾超节点系列产品全面支持DeepSeek-V4。一个是开源大模型，一个是国产AI算力平台，看起来和视频编解码不是一回事，但工程逻辑是相通的。

当一个模型被大量开发者调用、部署、二次开发，它就不再只是一个模型文件，而会变成一种基础设施接口。围绕这个接口，从推理框架、算子库到芯片本身的指令集和互联，整套软硬件栈都要跟着重新打磨。

沧海是腾讯视频业务倒逼出来的一颗芯片，DeepSeek与升腾的适配，则是开源模型生态把国产算力栈逼向成熟。

尽管它们不是同一种产品，但都说明了一个现象：当应用场景的规模、负载和迭代周期都到了一定量级，软件和硬件就不会是两条分开的线。它们会在业务现场里相互磨合。

规模到了某个量级，"采购vs自研"的天平就会自然倾斜。

Google走了七年，AWS走了九年，字节走了三年。如今腾讯也走进了这个行列。

这种长周期的技术沉淀，也解释了沧海这次的成绩单。

没有横空出世，只有水到渠成

回看这次比赛可以发现，拿下三个档位全部指标第一的，是沧海V2的FPGA版本。

这款V2芯片目前已经成功点亮，计划于2026年下半年全面提供服务。它在画质不变的前提下，H.266压缩率较上一代提升超过30%，单芯片处理能力翻倍。

更值得注意的是，它把渲染、画质增强、编码塞进同一块硅。原本分散在多个模块里的工序，被压成一条流水线。

腾讯最终把这套能力接到了云媒体处理MPS产品上，以公有云、私有云或SDK等方式对外开放。

芯片如果只服务腾讯内部，它只是一个降本工具；通过云服务对外提供，它才会变成腾讯云音视频业务的一部分长期竞争力。

这就是MSU冠军给沧海的真正刻度——不是"中国也能造视频芯片"，而是"中国互联网公司也能跑通自下而上的研发路径"。

不是所有技术突破，都会以"弯道超车"的姿态出现。更多时候，它藏在请求、推理与延迟瓶颈的缝隙里。

应用场景，不再是技术的下游，而是技术的上游。

沧海赢下这只奖杯，重要的从来不是它打败了英特尔、AMD、英伟达等一众顶尖对手，而是它证明了一条技术路径的可行性。在中国这个市场，只要业务跑得够多、够真、够久，上游的生态就会自然长出来。

无论是视频生态里长出的沧海，还是AI生态里正在长成的DeepSeek与升腾，都在说同一件事：所谓"卡脖子"的焦虑，不需要靠押注一两次"横空出世"来回应。

赞 (0) 分享

暂无回复，快来抢沙发吧！

1 / 1 页

敬请注意：文中内容观点和各种评论不代表本网立场！若有违规侵权，请联系我们。

登录后参与讨论

新留园

腾讯七年磨一芯

购买奏折推广