Bubble's Brain 阅读手册 - 2025-09-23

AI资讯 2025/9/23

AI 日报

AI内容摘要

百度智能云千帆发布开源视觉理解模型Qianfan-VL，具备多尺寸适配与智能推理能力。Meta为Facebook Dating推出AI约会助手提升匹配精准度，行业正集体押注AI。阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni，能统一处理文本图像音频视频。
GPT-5等模型在SWE-BENCH PRO测试中表现不佳，暴露复杂任务处理局限。宇树科技G1人形机器人展示抗打击能力，新增反重力模式。Google Gemini AI助手进驻TCL电视，加剧AI电视助手市场竞争。
DeepSeek推出升级开源模型DeepSeek-V3.1-Terminus，优化编程和搜索性能。Cursor上线全新文档中心提供学习资源。开源项目CookLikeHOC和阿里巴巴DeepResearch智能体发布，反映社区对实用AI工具的需求。

Today’s AI News

百度智能云千帆团队发布全新的视觉理解模型Qianfan-VL并完全开源。该系列提供3B、8B和70B三种尺寸以适应不同规模企业需求。模型具备多尺寸适配、智能推理能力（8B和70B版本可处理复杂图表理解、视觉推理及数学解题）以及优异的OCR专家能力，能精准识别手写体和复杂版面。该模型基于百度自研的昆仑芯P800完成训练。
Meta公司为Facebook Dating推出AI约会助手，旨在提升匹配精准度。该助手能理解用户需求并建议精准目标，提供个人资料优化和每周推荐一位"惊喜匹配对象”的浪漫邂逅功能。数据显示18-29岁用户匹配次数同比增长10%，但与Tinder的5000万日活相比仍有差距。行业正集体押注AI，Match Group投资与OpenAI合作推出AI功能，Bumble创始人预言AI未来或能进行"虚拟约会”。
阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni。该模型能统一处理文本、图像、音频和视频，支持119种文本语言和19种语音输入，并具备实时流式输出能力。在36项音频视频基准测试中，Qwen3-Omni在22项达到领先水平，表现与Gemini2.5Pro相当。
在Scale AI的SWE-BENCH PRO测试中，GPT-5、Claude Opus 4.1和Gemini 2.5表现不佳，最高正确率不足25%。测试刻意避用训练数据，GPT-5解题尝试准确率虽达63%，但未回答率高达63.1%，暴露其在复杂任务前的局限。测试涵盖1865个真实商业问题，显示AI在处理如JavaScript等语言时表现波动。
宇树科技发布G1人形机器人新视频，展示其强大的抗打击能力，遭飞踢、推撞后仍能保持平衡并自主起身完成空翻。机器人新增"反重力模式”提升稳定性，配备3指力控灵巧手和23-43个关节电机，售价9.9万元起。公司称其潜力可用于工业巡检、电力运维等重复性工作。
Google宣布其Gemini AI 助手正式进驻Google TV平台，首批支持设备为TCL QM9K 系列电视。用户可通过语音或遥控器唤醒助手，其能根据剧情细节、偏好类型智能推荐节目，回顾落下的剧集，并回答广泛问题推荐相关YouTube资源。三星、LG也宣布将引入微软Copilot AI 助手，加剧AI电视助手市场竞争。
DeepSeek正式推出升级版DeepSeek-V3.1-Terminus模型并宣布开源。新模型修复了语言不一致和异常字符问题，优化了编程和搜索智能体性能。在非智能体类测试中性能提升0.2%至36.5%，在HLE（人类终极测试） 上深度推理能力显著增强，在网页浏览、编程测试中亦有小幅提升。模型已在官方App、网页端及API平台同步更新。
AI编程工具Cursor上线全新文档中心，域名更新为cursor.com/docs，旨在提供更系统便捷的学习体验。改进包括提供从初学者到资深程序员的丰富学习资源，中文文档同步更新以方便中文用户，并预告即将推出全新品牌官网。中文用户可访问https://cursor.com/zh/docs获取资料。
开源项目CookLikeHOC引发关注，该项目系统整理了《老乡鸡菜品溯源报告》内容，旨在让用户在家复刻老乡鸡的标准化烹饪风味。该项目于2025年9月23日发布，社区热度达14,612星，展现了开源社区对实用美食文化工具的旺盛需求。
由阿里巴巴NLP团队打造的开源深度研究智能体DeepResearch（通义深智） 同日发布。该项目旨在利用AI辅助深度复杂研究工作，代表大模型在专业垂直领域应用的前沿探索。项目社区热度达13,834星，反映了对提升研究效率的AI工具的广泛兴趣。