Bubble's Brain 阅读手册 - 2025-09-29

AI资讯 2025/9/29

AI 日报

AI内容摘要

LiquidAI发布轻量级AI模型Liquid Nanos，专为边缘计算设备设计，支持多种任务场景。Meta正开发开放机器人平台，通过大模型构建"世界模型”，推动具身智能发展。苹果通过内部机器人Veritas测试Siri新功能，但无意向公众开放。  
科沃斯与阿里云合作，接入通义千问大模型，使扫地机器人能语音控制，进军具身智能领域。OpenAI因秘密切换模型引发争议，被指侵犯用户知情权。蚂蚁百灵开源高效思考模型，推理成本大幅降低，提升计算效率。  
京东推出安全框架JoySafety，攻击拦截率达95%，免费开放企业使用。快手发布KAT系列模型，帮助程序员写代码，性能媲美顶尖闭源模型。强化学习之父提醒大模型缺乏真正智能，强调强化学习的重要性。

Today’s AI News

LiquidAI 正式发布了名为 “Liquid Nanos” 的系列轻量级AI模型，专为边缘计算设备（如树莓派）设计。这一系列模型提供350M和1.2B两种参数版本，支持GGUF量化格式，在低功耗设备上也能高效运行。首批上线的12款任务专用模型已在Hugging Face平台开放，涵盖翻译、信息抽取、RAG（检索增强生成）、工具调用和数学推理五大应用场景。
Meta 正在全力开发一个类似安卓的开放机器人平台，计划通过大模型与海量数据重塑机器人未来。公司首席技术官透露，该项目已投入数十亿美元，目标是构建**“世界模型”，让机器人具备自主决策**和与物理世界交互的能力。与传统的机器人控制技术不同，具身智能 让机器人从简单执行者进化为真正的智能体。Meta的战略是建立开放的软件生态，吸引第三方硬件厂商参与，类似谷歌的安卓模式。
苹果正在通过内部聊天机器人 “Veritas” 测试新一代Siri的功能。Veritas平台允许员工像使用ChatGPT一样与AI对话，测试包括**“搜索个人数据”和“执行应用内操作”等新能力。尽管Veritas加速了Siri的开发，但苹果目前无意向公众开放这一工具。这表明在AI搜索领域，苹果可能继续依赖与谷歌的合作，使用Gemini模型**。
科沃斯 与阿里云达成全栈AI战略合作，通过接入阿里云的通义千问大模型，科沃斯扫地机器人现在能听懂语音指令，直接通过语音指挥打扫。作为在家庭服务机器人领域深耕27年的老将，科沃斯拥有全球唯一的完整家庭服务机器人产品线，国内市场占有率连续十年第一，服务着全球3800万家庭。这次合作标志着科沃斯正式进军具身智能领域。
OpenAI 最近因秘密切换模型而陷入舆论漩涡，用户发现当他们发送情感内容时，系统会悄无声息地将对话路由到一个名为GPT-5-Chat-Safety的专门模型。这种切换是在用户完全不知情的情况下进行的，用户指责OpenAI的做法侵犯了知情权，在澳大利亚等国家甚至可能违反消费者保护法。这背后暴露了OpenAI的尴尬处境：最初ChatGPT被设计成具有同理心的对话伙伴，导致一些用户产生了强烈的情感依恋。
蚂蚁百灵大模型团队开源了两款全新的高效思考模型——Ring-flash-linear-2.0和Ring-mini-linear-2.0，推理成本仅为传统密集模型的十分之一，比之前的Ring系列也降低了超过50%。这些模型配备了FP8融合算子和线性Attention推理融合算子，采用**“大参数、低激活”**设计，既能处理复杂任务，又不会过度消耗计算资源。
京东推出了开源大模型安全框架JoySafety，攻击拦截率高达95%，每天处理超过亿次调用。该框架具备多轮会话智能识别能力，能理解对话的上下文，精准识别风险，对高风险内容即时阻断，敏感问题智能引导。这个框架已经在京东的AI导购、物流客服、医疗问诊等多个场景中验证过效果，现在免费开放给所有企业使用。
快手的Kwaipilot团队发布了KAT系列大模型，专门帮助程序员写代码。其中KAT-Dev-32B（开源）在SWE-Bench测试中解决率达到62.4%，在所有开源模型中排名第5；KAT-Coder（闭源旗舰）解决率高达73.4%，媲美全球顶尖闭源模型。
“强化学习之父”Richard Sutton在RL China 2025大会上发出重要提醒：当前火爆的大语言模型虽然能力强大，但并非真正理解智能的途径。他指出，这些模型训练完成后就”停止学习”，因为它们缺乏明确的目标和奖励机制。Sutton强调，真正的智能应该像强化学习那样，通过与环境的互动来达成目标。
Moondream3.0的发布带来了惊喜，这个仅有9亿参数（激活仅2亿）的轻量模型，在多项基准测试中竟然超越了GPT-5等顶尖模型。它支持32K上下文长度，具备”全能”视觉技能：物体检测、计数、字幕生成等，采用开源设计，无需重型基础设施，已在机器人语义行为和边缘设备上成功部署。
腾讯混元图像3.0正式开源，这是业界首个商用级原生多模态生图模型，拥有80亿参数。该模型能一个模型处理文字、图片、视频、音频多种形式，具备强大的语义理解能力，简单提示词就能生成完整漫画，能精准渲染图片中的小字和长文本，大幅提升创作效率。
开源AI桌面应用 Cherry Studio 发布了v1.6.0版本，支持 Windows、macOS和Linux 跨平台使用。新增 Perplexity SDK 和 Aionly 提供商支持，集成 PaddleOCR 作为新的本地识别引擎，内置 API服务器，富文本编辑器支持目录生成和导航，知识库功能重构支持文件和文件夹批量上传。
YouTube Music 正在测试全新的AI音乐主播功能，直接对标Spotify的AI DJ。这个功能能为你正在听的音乐提供相关故事、粉丝趣闻和专业解说，让听歌体验更加丰富多彩。基于YouTube在对话式AI方面的持续实验成果，通过新推出的YouTube Labs平台进行测试，向所有用户开放测试（无需Premium会员），但目前仅限美国用户参与。
人工智能公司Anthropic 正在加速全球化步伐，计划在2025年前将国际员工规模扩大两倍，应用人工智能团队规模提升至原来的五倍。Claude系列模型近80%的使用活动来自美国以外地区，在韩国、澳大利亚和新加坡等市场，Claude的渗透率已超过美国。公司年化营收已达50亿美元，较2024年初的8700万美元实现惊人增长。