OpenAI 推出了全新的图像生成模型 GPT Image 1.5,该模型在图像生成和编辑能力上实现了显著提升,能够精准地遵循用户指令并保留原图的核心要素。同时,它还优化了文本渲染效果,解决了以往 AI 绘图中常见的问题。此外,OpenAI 还加强了安全与合规团队,以确保生成内容的伦理与法律合规性。
【AiBase提要:】
🌟 新发布的 GPT Image1.5 模型大幅提升了图像生成和编辑能力。
🖼️ 用户可以通过 ChatGPT 轻松创建和编辑图像,提供了专业级的图像处理工具。
🔒 OpenAI 建立了专门的安全团队,确保生成内容的伦理与合规。
2、腾讯发布混元世界模型 1.5,开启实时交互的虚拟世界
腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过文字或图片快速生成独特的互动世界,并支持实时探索。模型具备实时交互、长范围的3D一致性和多样化的交互体验。此外,腾讯首次开源了业内最全面的实时世界模型训练体系,为AI生成内容的未来提供了全新可能。
小米正式进军高性能开源大模型赛道,发布全新基础语言模型 MiMo-V2-Flash,并以 MIT 协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点,在推理、代码生成与智能体任务中表现尤为突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,引发开发者社区广泛关注。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!
OpenAI 推出了全新的图像生成模型 GPT Image 1.5,该模型在图像生成和编辑能力上实现了显著提升,能够精准地遵循用户指令并保留原图的核心要素。同时,它还优化了文本渲染效果,解决了以往 AI 绘图中常见的问题。此外,OpenAI 还加强了安全与合规团队,以确保生成内容的伦理与法律合规性。
2、腾讯发布混元世界模型 1.5,开启实时交互的虚拟世界
腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过文字或图片快速生成独特的互动世界,并支持实时探索。模型具备实时交互、长范围的3D一致性和多样化的交互体验。此外,腾讯首次开源了业内最全面的实时世界模型训练体系,为AI生成内容的未来提供了全新可能。
3、小米开源3090亿参数MiMo-V2-Flash大模型,推理速度碾压主流竞品,API低至0.1美元/百万Token
小米正式进军高性能开源大模型赛道,发布全新基础语言模型 MiMo-V2-Flash,并以 MIT 协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点,在推理、代码生成与智能体任务中表现尤为突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,引发开发者社区广泛关注。
4、字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!
字节跳动发布 Seedance 1.5 Pro,标志着AI音视频创作进入100%视听同步时代,为用户带来更丰富的视听体验。
5、Apple Music 将与 ChatGPT 实现全新集成,用户可轻松创建歌单!
OpenAI 宣布 Apple Music 将与 ChatGPT 实现集成,用户可以通过自然语言指令轻松创建歌单和查找音乐,这将极大提升用户体验的便捷性。
6、Gemini预测市场全美上线: 50 州用户可实时交易现实事件,免手续费限时开放
Gemini正式将预测市场产品Gemini Predictions推向全美,允许用户围绕真实世界事件进行预测性交易。平台基于合规框架构建,采用链下撮合、链上结算机制,保障速度与透明度。为加速用户 adoption,Gemini推出限时零手续费活动。
7、Adobe Firefly视频功能大升级:支持精准提示编辑、集成FLUX.2与Astra,告别“重做整段视频”时代
Adobe Firefly视频功能迎来重大更新,新增支持基于文本提示的精准局部修改,并整合多个第三方模型,提升创作自由度和画质。新功能还带来可视化时间轴界面和相机运动迁移能力,为短视频创作者提供电影级运镜。
8、谷歌实验室推出 AI 助手 CC:集成 Gemini 技术,打造智能“日程管家”
谷歌实验室推出了基于 Gemini 技术的全新 AI 助手 CC,通过深度整合谷歌生态系统,帮助用户实现全自动化的日程梳理与任务管理。