中国电信人工智能研究院(TeleAI)发布了一项突破性的生成式视频压缩技术——GVC(Generative Video Compression),该技术将视频数据的压缩率提升至0.02%。这项技术的核心逻辑是“用计算换带宽”,通过传递“如何画出画面”的指令,而非完整的画面像素,从而实现极致压缩。GVC在权威数据集上的测试表现远超传统算法,在同等视觉质量下,传统方法消耗的带宽是GVC的6倍以上。目前,该模型已能在消费级显卡上实现接近实时的生成速度,未来有望在极端网络环境下解决高清视频传输问题。
【AiBase提要:】
🧠 逻辑转变: 改变了传统的像素搬运模式,通过传输高维语义 Token 并利用生成式 AI 在终端“重绘”视频。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、百度文心 ERNIE-5.0-0110 正式发布,数学能力全球第二
百度最新发布的文心大模型 ERNIE-5.0-0110 在多项权威评测中表现出色,尤其在数学处理能力上位列全球第二。该模型在编程开发、专家知识储备和创意写作等方面也实现了显著增强,能够更精准地执行复杂指令。
2、阶跃星辰语音模型 Step-Audio-R1.1 荣登全球第一
阶跃星辰公司推出的开源语音推理模型Step-Audio-R1.1在全球人工智能模型评测中取得第一名的佳绩,展现了其在音频处理和逻辑推理方面的卓越能力。该模型具有深度语音推理能力和实时响应功能,能够端到端理解语音内容,同时支持流式推理。用户可以通过HuggingFace免费下载模型,并在开放平台进行试用。
3、千问全面接入阿里生态:点外卖、买机票一句话搞定,开启“AI 办事”时代
千问App全面接入阿里核心生态业务,实现了点外卖、购物、订机票等AI办事功能。此次升级上线了超过400项AI办事功能,并向所有用户开放测试。千问通过技术突破,提升了实时工具构建、全模态理解能力以及超长上下文处理能力,使AI能够看懂界面并执行复杂的多步骤规划。目前,千问已深入民生与出行场景,接入了包括签证、公积金等50项政务服务,并能调用飞猪和高德完成行程规划甚至代拨电话预订餐厅。
4、机器人也能“打短工”:租赁平台擎天租完成融资,用户突破20万
擎天租作为一家由具身智能领军企业联合发起的机器人租赁平台,通过创新的商业模式解决了机器人产业落地成本高和场景碎片化的痛点。该平台已完成种子轮融资,并计划在全国范围内扩展服务网络,以实现更大的市场影响力。
5、视频压缩率达0.02%:中国电信发布生成式视频压缩技术GVC
中国电信人工智能研究院(TeleAI)发布了一项突破性的生成式视频压缩技术——GVC(Generative Video Compression),该技术将视频数据的压缩率提升至0.02%。这项技术的核心逻辑是“用计算换带宽”,通过传递“如何画出画面”的指令,而非完整的画面像素,从而实现极致压缩。GVC在权威数据集上的测试表现远超传统算法,在同等视觉质量下,传统方法消耗的带宽是GVC的6倍以上。目前,该模型已能在消费级显卡上实现接近实时的生成速度,未来有望在极端网络环境下解决高清视频传输问题。
6、国产旗舰集体押注AI实体按键?荣耀Magic8已先行,五大厂商暗战升级
国产手机厂商对AI实体按键的关注,以及其可能带来的交互方式变革。
7、字节跳动加速硬件布局:豆包AI耳机由歌尔代工,AI眼镜量产10万台,手机助手样机售罄
字节跳动正在加速布局豆包AI硬件生态,从耳机到眼镜再到手机助手,展现出其构建全场景AI入口的战略意图。
8、正面硬刚 Google 翻译:OpenAI 秘密上线专属翻译网页,支持图片与文档
OpenAI 推出 ChatGPT Translate,功能强大且交互性高,直接对标 Google 翻译。该工具支持多模态输入、意译优先以及对话式微调,展现了 OpenAI 在消费者产品领域的战略转型。