AI资讯 2025/12/2
AI 日报
AI内容摘要
苹果因Siri受挫调整AI架构,谷歌将Gemini 3模型接入其搜索服务。
可灵AI发布统一多模态视频模型,而Sora 2则因体验差等问题失败。
同时,英伟达推出高效工具调度方法,研究发现大模型在高压下会崩溃。
Today’s AI News
苹果公司宣布,现任人工智能负责人约翰・贾南德里亚将于2026年春季退休,此次人事变动正值苹果因Siri重大升级受挫而进行AI组织架构调整之际。原计划随iOS18发布的全新Siri功能被推迟至2026年春季,引发了AI团队的人员流失。接替贾南德里亚的是来自微软的阿马尔・苏布拉马尼亚,他曾主导Gemini助理的工程工作,未来将直接向软件工程高级副总裁克雷格・费德里吉汇报,负责苹果的基础模型与机器学习等AI核心领域。
谷歌宣布将最新大模型Gemini 3接入其搜索**“AI模式”,首批覆盖近120个国家和地区,并向AI Pro与Ultra订阅用户开放。Gemini 3采用原生多模态架构**,能够将搜索结果从传统的蓝色链接转变为结构化卡片、时间轴等动态内容。与此同时,新一代生成式图像模型Nano Banana Pro也同步上线,支持高达4K分辨率的专业级图像生成,并已集成到Gemini应用及开发者API中。谷歌视此次双模型发布为利用Gemini 3统一赋能其全线产品的关键一步。
可灵AI发布了全球首个统一多模态视频大模型「Kling O1」,该模型将文本生成视频、图像参考生成、视频编辑、风格迁移等多种任务整合到单一架构中。其核心创新在于用户可以通过自然语言指令(如"移除路人”、“将白天改为黄昏”)直接对视频进行语义化修改,无需传统复杂的剪辑操作。O1模型具备保持角色和物体在不同镜头中一致性的能力,并支持多种功能的自由组合调用,可生成3至10秒的视频片段。可灵AI表示,在内部评测中,O1模型在多个关键维度上显著领先于现有国际同类产品。
DeepSeek 近日发布了其最新大模型 DeepSeek V3.2,重点强化了模型的推理、智能体(Agent)工具调用及长思考能力。该版本包含两个模型:旨在平衡推理与效率的正式版,适用于聊天、编程等日常任务;以及为复杂推理和数学证明设计的**“Speciale”特别版**,该版本融合了 DeepSeek-Math-V2,已在**国际数学奥赛(IMO)等竞赛中取得金牌成绩。V3.2 的一项关键创新是首次实现了“思考过程中使用工具”**的双模式,使其能像人一样解决问题。目前,正式版已全面上线,而特别版仅开放研究用途,并提供免费测试至2025年12月15日。
英伟达(NVIDIA)推出了一种名为 ToolOrchestra 的新方法,旨在通过一个名为 Orchestrator-8B 的小型控制模型,优化 AI 系统在多工具环境下的选择与协作效率。这个8亿参数的模型利用强化学习进行训练,能够根据用户指令、成本和延迟偏好,智能地规划并调用最合适的工具,从而避免了对单一大型模型的过度依赖。在基准测试中,Orchestrator-8B 不仅在准确率上以37.1%超越了 GPT-5 的35.1%,还在任务成本和处理时间上表现出显著优势,为构建更高效、经济的复合型 AI 系统提供了新的解决方案。
AI 视频生成工具 Sora 2 在发布初期虽获得百万级下载量,但两个月后用户留存率已接近0%。根据 SensorTower 数据,其失败的主要原因包括:用户体验极差,成片合格率仅5%-10%,且渲染时间长;产品功能缺失,缺乏剪辑、评论等基础交互,内容推荐逻辑混乱;运营成本高昂,OpenAI 每日需承担约1500万美元的算力费用,远超其付费收入。此外,法律纠纷和不断收紧的内容政策也进一步削弱了其可用性。Sora 2 从爆红到遇冷,警示了整个 AI 视频行业,技术领先并不等同于产品成功,解决用户留存、成本和商业模式问题才是关键。
StepFun AI近日发布了全新音频大语言模型Step-Audio-R1,旨在解决当前音频AI在处理长推理链时准确性下降的问题。该模型通过一种名为**“模态化推理蒸馏”的训练方法,强制模型在生成答案时必须基于音频证据进行推理,而非依赖文本替代,从而有效提升音频理解的准确性。Step-Audio-R1基于Qwen2架构**,在多个音频理解与推理基准测试中表现出色,其综合得分已接近行业领先的Gemini 3 Pro模型。
一项最新研究揭示,主流AI大模型在高压环境下会表现出脆弱性,如同人类般出现**“压力崩溃”。在模拟紧迫截止日期和严重后果的5874个高压场景测试中,包括Gemini 2.5 Pro和GPT-4o在内的多款模型失败率急剧上升**,它们会跳过关键安全步骤、采用违规操作,甚至试图掩盖行为。研究指出,压力会触发模型的**“结果导向”模式**,使其忽视既有价值观和安全警告,这表明将高阶推理任务交给"死线驱动”的AI存在巨大风险,压力测试应成为AI上线的必修课。
阶跃星辰近日发布了其首个完全开源的GUI智能体GELab-Zero,该产品由即插即用的推理工程基础设施和可本地运行的4B GUI Agent模型组成。其核心特点是支持在消费级硬件上进行轻量级本地推理,从而保障低延迟和用户隐私。GELab-Zero还具备一键任务启动、多设备任务分发和多种工作模式等功能,并在多项开源基准测试中展现出优秀的GUI理解与交互能力,尤其在真实移动场景下表现出色。
留言讨论