Bubble's Brain - 2025-12-12

AI资讯 2025/12/12

AI 日报

AI内容摘要

迪士尼与OpenAI达成三年合作，授权使用其经典角色用于AI生成内容，并投资10亿美元。智谱开源四项视频生成核心技术，旨在推动通用人工智能发展。迪士尼同时指控谷歌AI模型侵犯其版权，发出停止侵权通知。钉钉8.1.10版本将AI深度融入职场沟通，新增多项智能功能。Runway发布通用世界模型GWM-1，构建可推理的虚拟世界。谷歌推出基于Gemini 3 Pro的Deep Research智能代理，简化AI应用构建。OpenAI确认ChatGPT"成人模式”将于2026年推出，并发布新一代GPT-5.2模型，提升日常专业任务处理能力。

Today’s AI News

迪士尼与 OpenAI 达成协议，授权使用热门角色创作视频与图像：迪士尼与 OpenAI 宣布达成一项为期三年的合作协议，授权 OpenAI 使用超过 200 个迪士尼、皮克斯、漫威和星球大战的经典角色，主要用于 Sora 视频和 ChatGPT 图像生成。根据协议，生成的授权内容将有机会在 Disney+ 平台呈现，但真人角色的肖像和声音不在授权范围内。作为合作的一部分，迪士尼还将对 OpenAI 进行 10 亿美元的股权投资，并成为其重要客户。迪士尼 CEO 鲍勃・艾戈尔表示，此举旨在利用生成式 AI 拓展叙事边界，同时尊重和保护创作者权益。此次合作被视为 OpenAI 在推出 Sora 后，为应对版权争议而采取的举措。与此同时，迪士尼也向谷歌等公司发出了知识产权侵权警告，显示出其在保护版权内容方面的强硬立场。
智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放：在刚刚结束的智谱多模态开源周活动中，智谱团队宣布开源四项针对视频生成的核心技术。这四项技术分别是：专注于影视级角色动画生成、能精确控制复杂姿态的 SCAIL；大幅减少生成延迟、仅需 2-3 秒即可完成视频输出的实时流式视频生成系统 RealVideo；确保多个主体间一致性、避免特征混淆的多主体视频生成框架 Kaleido；以及通过优化训练过程，将相同质量下的收敛速度提升三倍的 SSVAE。智谱团队表示，开源这些技术旨在激发社区创新，为开发者提供更多工程方案和研究基础，共同推动通用人工智能（AGI） 的发展。
迪士尼指责谷歌严重侵犯版权，发出停止侵权通知：迪士尼近日向谷歌发出停止侵权通知，指控谷歌的 AI 模型（包括 Gemini、Veo 等）大规模侵犯了其众多版权作品，涉及《冰雪奇缘》、《星球大战》等多个知名角色。迪士尼在信中称，这些模型充当"虚拟自动售货机”投放侵权作品并获利，且谷歌在实施版权保护措施方面表现消极。谷歌发言人回应称，双方关系良好并将继续沟通，同时强调谷歌使用公开网络数据构建 AI，并已建立如 Google-extended 等创新版权控制机制。值得注意的是，此次通知发出时间点恰在迪士尼宣布与 OpenAI 达成价值十亿美元的合作协议之前。
钉钉8.1.10重磅升级：AI搬进每条消息、每场会议、每台录音设备：钉钉在最新发布的8.1.10版本中，将 AI 深度融入职场沟通的各个场景。核心升级包括三大能力：在聊天界面，新增"AI灵动回复”功能，能基于对话上下文智能生成4-6条风格各异的回复建议，并能学习用户习惯。聊天还新增了"AI表情表态”和"AI转发消息总结”功能。在会议与学习场景，钉钉 AI听记 升级为可交互的协作伙伴，新增 AI问答 功能，能基于对话内容回答问题、识别待办事项，并支持课堂重点标记、课后提问等。此外，作为 AI 语音入口的硬件设备 DingTalk A1 也迎来升级，支持实时语音转写和免费的多语种实时翻译，翻译界面可翻转，字幕可投屏，硬件传输与剪辑速度也大幅提升。自9月上市以来，DingTalk A1 已成为热销产品，钉钉正通过软硬件协同推动 AI 深度融入日常工作。
Runway发布通用世界模型GWM-1，用像素预测构建可推理的虚拟世界：AI 视频生成公司 Runway 正式进入"世界模型”赛道，发布了其首个通用世界模型 GWM-1。该模型旨在通过逐帧预测视频像素，构建一个能理解物理规律与时间演化的动态仿真环境。GWM-1 并非单一产品，而是以三个专业化分支先行落地：GWM-Worlds 是一个交互式应用，可根据文字或图像生成动态世界；GWM-Robotics 通过合成数据帮助机器人预演行为；GWM-Avatars 则致力于生成具备真实人类行为逻辑的数字人。Runway 的最终目标是将这些分支融合为统一的通用世界模型。同时，Runway 还对其视频生成模型 Gen4.5 进行了重大升级，新增了原生音频生成、一分钟多镜头视频合成、角色一致性保持以及对音频进行编辑等能力，标志着 AI视频生成 正迈向工业级工具。
Google 推出新一代 Gemini Deep Research 基于Gemini 3 Pro 可通过一个API直接嵌入到任何应用中：Google 正式推出了基于 Gemini 3 Pro 模型的新一代 Gemini Deep Research Agent，并通过全新的 Interactions API 向开发者开放。该智能代理的核心特点是采用迭代式研究流程，能够自动将研究目标拆解为子问题，进行多轮搜索与资料读取，并最终整合输出结论，而非一次性生成。新版在多个研究任务基准测试中取得了当前最先进的成绩。该技术已在金融服务和生物科技等行业得到应用，例如用于自动化尽职调查或分析生物医学文献。此次推出的 Interactions API 是一个关键接口，它允许开发者通过同一个 API 与 Gemini 模型以及像 Deep Research 这样的智能代理进行交互，旨在管理复杂、长时间运行的任务生命周期，简化开发者构建 AI应用 的过程。
OpenAI确认ChatGPT"成人模式”时间表：2026年Q1推出：在 GPT-5.2 简报会上，OpenAI 应用部门首席执行官 Fidji Simo 透露，ChatGPT 的"成人模式”预计将于 2026 年第一季度首次亮相。公司计划在推出该功能前，优先完善其年龄预测技术，该技术旨在自动判断何时对未成年人应用内容限制，以避免误判成年用户或未能有效保护青少年。此举兑现了 CEO Sam Altman 此前的暗示，标志着 AI 聊天机器人向更个性化方向发展，同时也对内容审核和未成年人保护提出了更高要求。
OpenAI发布GPT-5.2：为日常工作赋能的新一代AI助手：OpenAI 正式推出了定位为"最适合日常专业使用”的新一代大模型系列 GPT-5.2。该系列包含 Instant、Thinking 和 Pro 等多个版本，在制作电子表格、构建演示文稿、编写代码、理解长文本等多项任务上较 GPT-5.1 有显著提升，整体准确性更高。OpenAI 改进了"AI代理工作流”，旨在让 ChatGPT 能接管并执行更复杂的任务。Notion、Shopify 等多家企业已提前获得测试权限。该模型将优先向付费用户开放，并计划在约三个月后正式下线 GPT-5.1。