AI资讯 2025/12/12
AI 日报
AI内容摘要
迪士尼与OpenAI达成三年合作,授权使用其经典角色用于AI生成内容,并投资10亿美元。智谱开源四项视频生成核心技术,旨在推动通用人工智能发展。迪士尼同时指控谷歌AI模型侵犯其版权,发出停止侵权通知。钉钉8.1.10版本将AI深度融入职场沟通,新增多项智能功能。Runway发布通用世界模型GWM-1,构建可推理的虚拟世界。谷歌推出基于Gemini 3 Pro的Deep Research智能代理,简化AI应用构建。OpenAI确认ChatGPT"成人模式”将于2026年推出,并发布新一代GPT-5.2模型,提升日常专业任务处理能力。
Today’s AI News
迪士尼与 OpenAI 达成协议,授权使用热门角色创作视频与图像:迪士尼与 OpenAI 宣布达成一项为期三年的合作协议,授权 OpenAI 使用超过 200 个迪士尼、皮克斯、漫威和星球大战的经典角色,主要用于 Sora 视频和 ChatGPT 图像生成。根据协议,生成的授权内容将有机会在 Disney+ 平台呈现,但真人角色的肖像和声音不在授权范围内。作为合作的一部分,迪士尼还将对 OpenAI 进行 10 亿美元的股权投资,并成为其重要客户。迪士尼 CEO 鲍勃・艾戈尔表示,此举旨在利用生成式 AI 拓展叙事边界,同时尊重和保护创作者权益。此次合作被视为 OpenAI 在推出 Sora 后,为应对版权争议而采取的举措。与此同时,迪士尼也向谷歌等公司发出了知识产权侵权警告,显示出其在保护版权内容方面的强硬立场。
智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放:在刚刚结束的智谱多模态开源周活动中,智谱团队宣布开源四项针对视频生成的核心技术。这四项技术分别是:专注于影视级角色动画生成、能精确控制复杂姿态的 SCAIL;大幅减少生成延迟、仅需 2-3 秒即可完成视频输出的实时流式视频生成系统 RealVideo;确保多个主体间一致性、避免特征混淆的多主体视频生成框架 Kaleido;以及通过优化训练过程,将相同质量下的收敛速度提升三倍的 SSVAE。智谱团队表示,开源这些技术旨在激发社区创新,为开发者提供更多工程方案和研究基础,共同推动通用人工智能(AGI) 的发展。
迪士尼指责谷歌严重侵犯版权,发出停止侵权通知:迪士尼近日向谷歌发出停止侵权通知,指控谷歌的 AI 模型(包括 Gemini、Veo 等)大规模侵犯了其众多版权作品,涉及《冰雪奇缘》、《星球大战》等多个知名角色。迪士尼在信中称,这些模型充当"虚拟自动售货机”投放侵权作品并获利,且谷歌在实施版权保护措施方面表现消极。谷歌发言人回应称,双方关系良好并将继续沟通,同时强调谷歌使用公开网络数据构建 AI,并已建立如 Google-extended 等创新版权控制机制。值得注意的是,此次通知发出时间点恰在迪士尼宣布与 OpenAI 达成价值十亿美元的合作协议之前。
钉钉8.1.10重磅升级:AI搬进每条消息、每场会议、每台录音设备:钉钉在最新发布的8.1.10版本中,将 AI 深度融入职场沟通的各个场景。核心升级包括三大能力:在聊天界面,新增"AI灵动回复”功能,能基于对话上下文智能生成4-6条风格各异的回复建议,并能学习用户习惯。聊天还新增了"AI表情表态”和"AI转发消息总结”功能。在会议与学习场景,钉钉 AI听记 升级为可交互的协作伙伴,新增 AI问答 功能,能基于对话内容回答问题、识别待办事项,并支持课堂重点标记、课后提问等。此外,作为 AI 语音入口的硬件设备 DingTalk A1 也迎来升级,支持实时语音转写和免费的多语种实时翻译,翻译界面可翻转,字幕可投屏,硬件传输与剪辑速度也大幅提升。自9月上市以来,DingTalk A1 已成为热销产品,钉钉正通过软硬件协同推动 AI 深度融入日常工作。
Runway发布通用世界模型GWM-1,用像素预测构建可推理的虚拟世界:AI 视频生成公司 Runway 正式进入"世界模型”赛道,发布了其首个通用世界模型 GWM-1。该模型旨在通过逐帧预测视频像素,构建一个能理解物理规律与时间演化的动态仿真环境。GWM-1 并非单一产品,而是以三个专业化分支先行落地:GWM-Worlds 是一个交互式应用,可根据文字或图像生成动态世界;GWM-Robotics 通过合成数据帮助机器人预演行为;GWM-Avatars 则致力于生成具备真实人类行为逻辑的数字人。Runway 的最终目标是将这些分支融合为统一的通用世界模型。同时,Runway 还对其视频生成模型 Gen4.5 进行了重大升级,新增了原生音频生成、一分钟多镜头视频合成、角色一致性保持以及对音频进行编辑等能力,标志着 AI视频生成 正迈向工业级工具。
Google 推出新一代 Gemini Deep Research 基于Gemini 3 Pro 可通过一个API直接嵌入到任何应用中:Google 正式推出了基于 Gemini 3 Pro 模型的新一代 Gemini Deep Research Agent,并通过全新的 Interactions API 向开发者开放。该智能代理的核心特点是采用迭代式研究流程,能够自动将研究目标拆解为子问题,进行多轮搜索与资料读取,并最终整合输出结论,而非一次性生成。新版在多个研究任务基准测试中取得了当前最先进的成绩。该技术已在金融服务和生物科技等行业得到应用,例如用于自动化尽职调查或分析生物医学文献。此次推出的 Interactions API 是一个关键接口,它允许开发者通过同一个 API 与 Gemini 模型以及像 Deep Research 这样的智能代理进行交互,旨在管理复杂、长时间运行的任务生命周期,简化开发者构建 AI应用 的过程。
OpenAI确认ChatGPT"成人模式”时间表:2026年Q1推出:在 GPT-5.2 简报会上,OpenAI 应用部门首席执行官 Fidji Simo 透露,ChatGPT 的"成人模式”预计将于 2026 年第一季度首次亮相。公司计划在推出该功能前,优先完善其年龄预测技术,该技术旨在自动判断何时对未成年人应用内容限制,以避免误判成年用户或未能有效保护青少年。此举兑现了 CEO Sam Altman 此前的暗示,标志着 AI 聊天机器人向更个性化方向发展,同时也对内容审核和未成年人保护提出了更高要求。
OpenAI发布GPT-5.2:为日常工作赋能的新一代AI助手:OpenAI 正式推出了定位为"最适合日常专业使用”的新一代大模型系列 GPT-5.2。该系列包含 Instant、Thinking 和 Pro 等多个版本,在制作电子表格、构建演示文稿、编写代码、理解长文本等多项任务上较 GPT-5.1 有显著提升,整体准确性更高。OpenAI 改进了"AI代理工作流”,旨在让 ChatGPT 能接管并执行更复杂的任务。Notion、Shopify 等多家企业已提前获得测试权限。该模型将优先向付费用户开放,并计划在约三个月后正式下线 GPT-5.1。
留言讨论