AI 洞察日报 - 2025-09-29

AI资讯 2025/9/29

AI 日报

AI内容摘要

LiquidAI发布轻量级AI模型Liquid Nanos,专为边缘计算设备设计,支持多种任务场景。Meta正开发开放机器人平台,通过大模型构建"世界模型”,推动具身智能发展。苹果通过内部机器人Veritas测试Siri新功能,但无意向公众开放。  
科沃斯与阿里云合作,接入通义千问大模型,使扫地机器人能语音控制,进军具身智能领域。OpenAI因秘密切换模型引发争议,被指侵犯用户知情权。蚂蚁百灵开源高效思考模型,推理成本大幅降低,提升计算效率。  
京东推出安全框架JoySafety,攻击拦截率达95%,免费开放企业使用。快手发布KAT系列模型,帮助程序员写代码,性能媲美顶尖闭源模型。强化学习之父提醒大模型缺乏真正智能,强调强化学习的重要性。

Today’s AI News

  1. LiquidAI 正式发布了名为 “Liquid Nanos” 的系列轻量级AI模型,专为边缘计算设备(如树莓派)设计。这一系列模型提供350M1.2B两种参数版本,支持GGUF量化格式,在低功耗设备上也能高效运行。首批上线的12款任务专用模型已在Hugging Face平台开放,涵盖翻译、信息抽取、RAG(检索增强生成)、工具调用和数学推理五大应用场景。

  2. Meta 正在全力开发一个类似安卓的开放机器人平台,计划通过大模型与海量数据重塑机器人未来。公司首席技术官透露,该项目已投入数十亿美元,目标是构建**“世界模型”,让机器人具备自主决策**和与物理世界交互的能力。与传统的机器人控制技术不同,具身智能 让机器人从简单执行者进化为真正的智能体。Meta的战略是建立开放的软件生态,吸引第三方硬件厂商参与,类似谷歌的安卓模式。

  3. 苹果 正在通过内部聊天机器人 “Veritas” 测试新一代Siri的功能。Veritas平台允许员工像使用ChatGPT一样与AI对话,测试包括**“搜索个人数据”“执行应用内操作”等新能力。尽管Veritas加速了Siri的开发,但苹果目前无意向公众开放这一工具。这表明在AI搜索领域,苹果可能继续依赖与谷歌的合作,使用Gemini模型**。

  4. 科沃斯阿里云达成全栈AI战略合作,通过接入阿里云的通义千问大模型,科沃斯扫地机器人现在能听懂语音指令,直接通过语音指挥打扫。作为在家庭服务机器人领域深耕27年的老将,科沃斯拥有全球唯一的完整家庭服务机器人产品线,国内市场占有率连续十年第一,服务着全球3800万家庭。这次合作标志着科沃斯正式进军具身智能领域。

  5. OpenAI 最近因秘密切换模型而陷入舆论漩涡,用户发现当他们发送情感内容时,系统会悄无声息地将对话路由到一个名为GPT-5-Chat-Safety的专门模型。这种切换是在用户完全不知情的情况下进行的,用户指责OpenAI的做法侵犯了知情权,在澳大利亚等国家甚至可能违反消费者保护法。这背后暴露了OpenAI的尴尬处境:最初ChatGPT被设计成具有同理心的对话伙伴,导致一些用户产生了强烈的情感依恋。

  6. 蚂蚁百灵大模型团队开源了两款全新的高效思考模型——Ring-flash-linear-2.0Ring-mini-linear-2.0,推理成本仅为传统密集模型的十分之一,比之前的Ring系列也降低了超过50%。这些模型配备了FP8融合算子和线性Attention推理融合算子,采用**“大参数、低激活”**设计,既能处理复杂任务,又不会过度消耗计算资源。

  7. 京东推出了开源大模型安全框架JoySafety,攻击拦截率高达95%,每天处理超过亿次调用。该框架具备多轮会话智能识别能力,能理解对话的上下文,精准识别风险,对高风险内容即时阻断,敏感问题智能引导。这个框架已经在京东的AI导购、物流客服、医疗问诊等多个场景中验证过效果,现在免费开放给所有企业使用。

  8. 快手的Kwaipilot团队发布了KAT系列大模型,专门帮助程序员写代码。其中KAT-Dev-32B(开源)在SWE-Bench测试中解决率达到62.4%,在所有开源模型中排名第5;KAT-Coder(闭源旗舰)解决率高达73.4%,媲美全球顶尖闭源模型。

  9. 强化学习之父Richard Sutton在RL China 2025大会上发出重要提醒:当前火爆的大语言模型虽然能力强大,但并非真正理解智能的途径。他指出,这些模型训练完成后就”停止学习”,因为它们缺乏明确的目标和奖励机制。Sutton强调,真正的智能应该像强化学习那样,通过与环境的互动来达成目标。

  10. Moondream3.0的发布带来了惊喜,这个仅有9亿参数(激活仅2亿)的轻量模型,在多项基准测试中竟然超越了GPT-5等顶尖模型。它支持32K上下文长度,具备”全能”视觉技能:物体检测、计数、字幕生成等,采用开源设计,无需重型基础设施,已在机器人语义行为边缘设备上成功部署。

  11. 腾讯混元图像3.0正式开源,这是业界首个商用级原生多模态生图模型,拥有80亿参数。该模型能一个模型处理文字、图片、视频、音频多种形式,具备强大的语义理解能力,简单提示词就能生成完整漫画,能精准渲染图片中的小字和长文本,大幅提升创作效率。

  12. 开源AI桌面应用 Cherry Studio 发布了v1.6.0版本,支持 Windows、macOS和Linux 跨平台使用。新增 Perplexity SDKAionly 提供商支持,集成 PaddleOCR 作为新的本地识别引擎,内置 API服务器,富文本编辑器支持目录生成和导航,知识库功能重构支持文件和文件夹批量上传。

  13. YouTube Music 正在测试全新的AI音乐主播功能,直接对标Spotify的AI DJ。这个功能能为你正在听的音乐提供相关故事、粉丝趣闻和专业解说,让听歌体验更加丰富多彩。基于YouTube在对话式AI方面的持续实验成果,通过新推出的YouTube Labs平台进行测试,向所有用户开放测试(无需Premium会员),但目前仅限美国用户参与。

  14. 人工智能公司Anthropic 正在加速全球化步伐,计划在2025年前将国际员工规模扩大两倍,应用人工智能团队规模提升至原来的五倍Claude系列模型近80%的使用活动来自美国以外地区,在韩国、澳大利亚和新加坡等市场,Claude的渗透率已超过美国。公司年化营收已达50亿美元,较2024年初的8700万美元实现惊人增长。