腾讯七年磨一芯

小新 正三品 (侍郎) 2026-05-29 08:12 14 0 返回 新闻时事
小新 正三品 (侍郎) 楼主
2026-05-29 08:12
第1楼

AI摘要:(文/陈济深 编辑/张广凯)

5月26日,腾讯赢了一场和英伟达、AMD、英特尔同台的比赛。

三年后的2022年3月,沧海V1顺利点亮;2023年进入量产。五年后,整个行业的同一笔账,会被一位UP主用另一种方式摆到大众面前。

2024年10月,UP主"影视飓风"发了一条名为《清晰度不如4年前!


(文/陈济深 编辑/张广凯)

5月26日,腾讯赢了一场和英伟达、AMD、英特尔同台的比赛。

作为一项办了20多年的权威评测,莫斯科国立大学(MSU)的视频编码比赛与谷歌、英特尔、英伟达、AMD等芯片大厂保持评测合作或长期往来,是该领域少数被业界公认的"裁判席",业内把它视作硬件视频编码的"奥林匹克"。

今年的硬件视频编码比赛有41款硬件编码器参赛,覆盖H.264、H.265、AV1、H.266全部主流标准。

腾讯自研编解码系列芯片"沧海",在30fps、60fps、120fps、240fps四个速度档位、所有评测指标(SSIM、PSNR、VMAF)里全部第一,多项指标领先超30%。

MSU 2026硬件视频编码比赛榜单,腾讯沧海V2/V1包揽多档第一

但比这次冠军本身更值得问的是:腾讯这颗自研芯片,是怎么出现的?

一笔成本账,逼出一颗芯

故事的起点,要回到七年前。

2019年的腾讯,视频业务已经不只是腾讯视频和直播。微信视频号正在准备阶段,云游戏开始浮现,对外提供服务的腾讯云媒体处理MPS也已经在线运营。

这些业务每天都在生成同一个问题:一帧画面,从被上传、转码、存储到分发到用户手机上,每一步都在花钱。

视频行业最重的成本,从来不在视频制作上,而在基建,也就是每一帧画面抵达用户之前的那条链路里。解码、分析、增强、编码、存储以及分发等,任何一个环节多出来一点点成本,乘以微信视频号、腾讯视频、QQ、直播和云游戏这套体量,都会变成一张很长的账单。

这张账单过去的解法,往往是通过堆量采购更多服务器、租更多CDN节点来摊平。

但当业务规模大到一定量级,这种摊成本的方法也会开始失效。再多的通用服务器,也不如一颗为视频专门设计的芯片省钱。

腾讯做了一个判断:自己造一颗。

那一年,"沧海"项目正式立项。三年后的2022年3月,沧海V1顺利点亮;2023年进入量产。

如果说通用芯片追求的是尽可能适配更多场景,专用芯片追求的就是在一个确定场景里把效率抠到极致。前者解决"能不能做",后者解决"值不值得这样做"。沧海诞生的使命,显然是后者。

对腾讯来说,视频就是那个最值得做专用芯片的场景:它确定、高频,也足够昂贵。

这套逻辑,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生后来在2021年的腾讯数字生态大会上有过更直接的表述:腾讯造芯,"是需求驱动,基于自身存在需要解决的问题"。

五年后,整个行业的同一笔账,会被一位UP主用另一种方式摆到大众面前。

2024年10月,UP主"影视飓风"发了一条名为《清晰度不如4年前!视频变糊是你的错觉吗?》的视频,直指各大视频平台过度压缩视频:名义上的4K不如四年前的1080P清晰。

视频上线后引起广泛讨论,但留下了一个外界很少正面回应的问题:视频平台为什么要偷偷降画质?

答案不浪漫,还是那个字:钱。

翻开爱奇艺的财报:2020年全年带宽费用24亿元,即便想尽办法压缩成本,到2023年Q2,一个季度就要4.5亿元。

腾讯没有选"偷偷压画质"这条路,它选了更慢、更重、也更彻底的一条:把账本反过来写进硬件,也就是沧海的架构。

腾讯把这套思路概括为"全链路软硬件协同"。更直白地说,就是不只靠芯片本身硬算,而是把码率控制、内容预分析、候选编码模式、画质判断和硬件架构一起优化。

视频里哪些画面该多分码率,哪些画面可以少分,哪些场景容易糊,哪些运动画面最吃编码器,这些问题只有在真实业务里长期跑,才会形成足够细的经验。

这不是把一颗芯片塞进数据中心,而是把数据中心的经验,一刀一刀刻进硅里。

数据中心里的"老员工"

2023年沧海V1量产。到2026年的今天,按腾讯云披露的数据,沧海芯片在腾讯云及腾讯自有场景中已经部署超过10万片,覆盖直播点播、4K转码、云游戏等业务。

"超过10万片"是个什么概念?

公开数据显示,沧海单颗芯片编完一帧1080p视频只要4毫秒。10万片这种密度堆在一起,等于把一座大型转码机房,压进了一组组机柜里。

对芯片产业来说,"超过10万片"比"拿下比赛第一"更有分量。

比赛证明的是峰值能力,部署规模证明的是经济性。视频编解码芯片不是实验室里的参数游戏,它必须在数据中心里长期跑,要能把每一项成本真的压下去,还要能被云产品和内部业务调度起来。

否则,压缩率再漂亮,也只是工程样机里的奖杯,不会真的省下一分钱。

腾讯也公开过一项技术指标:在120fps的高帧率档位上,同等画质下,沧海比行业领先ASIC还能再节省10%的码率。这个10%,听起来不大。但当流量以 Tb 计算,每个百分点就是数以亿计的 CDN 流量成本。

MSU比赛上拿下240fps极速档全指标冠军的这颗V1,正是每天在腾讯视频和腾讯云数据中心里跑着的"老员工"。

沧海的价值,从来不在于"腾讯也能造芯"。它在于:沧海是先有场景、再有芯片的产物。这样长出来的芯片,从一开始就跑在能直接服务业务的轨道上。

这条路上,腾讯不是孤例。

大洋两岸,殊途同归

早在2015年前后,Google工程师就发现了一个让人头大的问题:YouTube用户上传的视频需要被转成8到15种规格分发,转码集群消耗的服务器数量大到惊人。

Google给出的答案,叫Argos VCU。

2021年,Google在ASPLOS大会上公开了第二代Argos——一颗专为YouTube转码而生的视频编码芯片,效率比传统服务器高出20到33倍,把原本要花几天才能跑完的4K视频转码压到几小时。

往更大的格局看,亚马逊从2015年开始的Nitro,到2018年的Graviton,再到2022年的Trainium,一路把云业务里每个高频环节都做成自研芯片。截至2024年中,AWS新增CPU容量里有一半已经跑在自研Graviton上。

国内的同一道题也不止腾讯一家在解。2023年,字节跳动旗下火山引擎也披露了自研视频编解码芯片,主要服务于抖音和西瓜视频。不同公司、不同业务,但路径出奇地一致。

视频之外,这条逻辑同样在AI算力栈里上演。

今年4月,DeepSeek-V4发布后,华为宣布升腾超节点系列产品全面支持DeepSeek-V4。一个是开源大模型,一个是国产AI算力平台,看起来和视频编解码不是一回事,但工程逻辑是相通的。

当一个模型被大量开发者调用、部署、二次开发,它就不再只是一个模型文件,而会变成一种基础设施接口。围绕这个接口,从推理框架、算子库到芯片本身的指令集和互联,整套软硬件栈都要跟着重新打磨。

沧海是腾讯视频业务倒逼出来的一颗芯片,DeepSeek与升腾的适配,则是开源模型生态把国产算力栈逼向成熟。

尽管它们不是同一种产品,但都说明了一个现象:当应用场景的规模、负载和迭代周期都到了一定量级,软件和硬件就不会是两条分开的线。它们会在业务现场里相互磨合。

规模到了某个量级,"采购vs自研"的天平就会自然倾斜。

Google走了七年,AWS走了九年,字节走了三年。如今腾讯也走进了这个行列。

这种长周期的技术沉淀,也解释了沧海这次的成绩单。

没有横空出世,只有水到渠成

回看这次比赛可以发现,拿下三个档位全部指标第一的,是沧海V2的FPGA版本。

这款V2芯片目前已经成功点亮,计划于2026年下半年全面提供服务。它在画质不变的前提下,H.266压缩率较上一代提升超过30%,单芯片处理能力翻倍。

更值得注意的是,它把渲染、画质增强、编码塞进同一块硅。原本分散在多个模块里的工序,被压成一条流水线。

腾讯最终把这套能力接到了云媒体处理MPS产品上,以公有云、私有云或SDK等方式对外开放。

芯片如果只服务腾讯内部,它只是一个降本工具;通过云服务对外提供,它才会变成腾讯云音视频业务的一部分长期竞争力。

这就是MSU冠军给沧海的真正刻度——不是"中国也能造视频芯片",而是"中国互联网公司也能跑通自下而上的研发路径"。

不是所有技术突破,都会以"弯道超车"的姿态出现。更多时候,它藏在请求、推理与延迟瓶颈的缝隙里。

应用场景,不再是技术的下游,而是技术的上游。

沧海赢下这只奖杯,重要的从来不是它打败了英特尔、AMD、英伟达等一众顶尖对手,而是它证明了一条技术路径的可行性。在中国这个市场,只要业务跑得够多、够真、够久,上游的生态就会自然长出来。

无论是视频生态里长出的沧海,还是AI生态里正在长成的DeepSeek与升腾,都在说同一件事:所谓"卡脖子"的焦虑,不需要靠押注一两次"横空出世"来回应。

暂无回复,快来抢沙发吧!

  • 1 / 1 页
敬请注意:文中内容观点和各种评论不代表本网立场!若有违规侵权,请联系我们