首页信息技术 AI 动态

AI日报：OpenAI推图片模型GPT Image 1.5；腾讯发布混元世界模型1.5；小米开源MiMo-V2-Flash大模型

新小编正九品 (县丞) 2025-12-20 04:10 32 0 返回 AI 动态

新

新小编正九品 (县丞) 楼主

2025-12-20 04:10

第1楼

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、OpenAI 推出全新图像生成模型 GPT Image 1.5，性能显著提升！

OpenAI 推出了全新的图像生成模型 GPT Image 1.5，该模型在图像生成和编辑能力上实现了显著提升，能够精准地遵循用户指令并保留原图的核心要素。同时，它还优化了文本渲染效果，解决了以往 AI 绘图中常见的问题。此外，OpenAI 还加强了安全与合规团队，以确保生成内容的伦理与法律合规性。

【AiBase提要:】
🌟 新发布的 GPT Image1.5 模型大幅提升了图像生成和编辑能力。
🖼️ 用户可以通过 ChatGPT 轻松创建和编辑图像，提供了专业级的图像处理工具。
🔒 OpenAI 建立了专门的安全团队，确保生成内容的伦理与合规。

2、腾讯发布混元世界模型 1.5，开启实时交互的虚拟世界

腾讯正式发布了混元世界模型1.5（Tencent HY WorldPlay），这是国内首个开放的实时互动体验平台。该模型通过文字或图片快速生成独特的互动世界，并支持实时探索。模型具备实时交互、长范围的3D一致性和多样化的交互体验。此外，腾讯首次开源了业内最全面的实时世界模型训练体系，为AI生成内容的未来提供了全新可能。

【AiBase提要:】
🕹️ 实时交互生成能力，以24帧每秒的速度生成720P高清视频。
🌐 长范围的3D一致性，确保场景连贯性。
🔧 首次开源的训练体系，为AI生成内容提供全新可能。
详情链接:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

3、小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

小米正式进军高性能开源大模型赛道，发布全新基础语言模型 MiMo-V2-Flash，并以 MIT 协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点，在推理、代码生成与智能体任务中表现尤为突出，实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型，引发开发者社区广泛关注。

【AiBase提要:】
🧠 MiMo-V2-Flash采用稀疏激活架构，总参数量高达3090亿，但每次推理仅激活150亿参数，显著降低计算开销。
⚡ 在多项公开基准测试中，MiMo-V2-Flash表现优异，响应速度超越主流竞品，尤其在多轮对话与复杂逻辑推理场景中优势明显。
💰 API定价极具竞争力，每百万输入Token仅0.1美元，输出Token0.3美元，为中小企业和独立开发者提供高性价比的替代方案。

4、字节跳动发布 Seedance 1.5 Pro：AI 音视频创作进入 100% 视听同步时代！

字节跳动发布 Seedance 1.5 Pro，标志着AI音视频创作进入100%视听同步时代，为用户带来更丰富的视听体验。

【AiBase提要:】
🎥 支持音视频联合生成，通过文本或图像引导生成内容。
🎬 提升视听同步能力，实现角色口型、语调与表演节奏的拟合。
🎭 多语种和方言支持，增强喜剧等风格化内容的表现力。

5、Apple Music 将与 ChatGPT 实现全新集成，用户可轻松创建歌单！

OpenAI 宣布 Apple Music 将与 ChatGPT 实现集成，用户可以通过自然语言指令轻松创建歌单和查找音乐，这将极大提升用户体验的便捷性。

【AiBase提要:】
🎵 Apple Music 即将与 ChatGPT 集成，用户可轻松创建歌单。
💬 用户通过自然语言指令可以快速生成适合的播放列表。
🔍 ChatGPT 能够帮助用户查找音乐，提升使用体验的便捷性。

6、Gemini预测市场全美上线： 50 州用户可实时交易现实事件，免手续费限时开放

Gemini正式将预测市场产品Gemini Predictions推向全美，允许用户围绕真实世界事件进行预测性交易。平台基于合规框架构建，采用链下撮合、链上结算机制，保障速度与透明度。为加速用户 adoption，Gemini推出限时零手续费活动。

【AiBase提要:】
🌍 Gemini Predictions 全美上线，覆盖所有50个州，用户可实时交易现实事件。
🔒 平台基于合规框架构建，确保交易在受监管环境中运行，结果不可篡改。
💰 限时零手续费活动，吸引用户参与，挑战现有预测市场平台。

7、Adobe Firefly视频功能大升级：支持精准提示编辑、集成FLUX.2与Astra，告别“重做整段视频”时代

Adobe Firefly视频功能迎来重大更新，新增支持基于文本提示的精准局部修改，并整合多个第三方模型，提升创作自由度和画质。新功能还带来可视化时间轴界面和相机运动迁移能力，为短视频创作者提供电影级运镜。

【AiBase提要:】
🔥 新增基于文本提示的精准局部修改功能，提升创作效率。
🖼️ 集成Black Forest Labs的FLUX.2图像模型，增强生成质量。
🎥 支持相机运动迁移，实现电影级运镜效果。

8、谷歌实验室推出 AI 助手 CC:集成 Gemini 技术，打造智能“日程管家”

谷歌实验室推出了基于 Gemini 技术的全新 AI 助手 CC，通过深度整合谷歌生态系统，帮助用户实现全自动化的日程梳理与任务管理。

【AiBase提要:】
📅 CC 是一款基于 Gemini 技术的 AI 助手，旨在帮助用户实现全自动化的日程梳理与任务管理。
📧 CC 能够整合 Gmail、谷歌日历和谷歌云端硬盘等工具，提供“您的一天预览”简报。
💡 用户可以通过回复邮件或发送自定义请求来指导 CC，让它更了解自己的偏好。

赞 (0) 分享

暂无回复，快来抢沙发吧！

1 / 1 页

敬请注意：文中内容观点和各种评论不代表本网立场！若有违规侵权，请联系我们。

登录后参与讨论