AI资讯 2025/9/23
AI 日报
AI内容摘要
百度智能云千帆发布开源视觉理解模型Qianfan-VL,具备多尺寸适配与智能推理能力。Meta为Facebook Dating推出AI约会助手提升匹配精准度,行业正集体押注AI。阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni,能统一处理文本图像音频视频。
GPT-5等模型在SWE-BENCH PRO测试中表现不佳,暴露复杂任务处理局限。宇树科技G1人形机器人展示抗打击能力,新增反重力模式。Google Gemini AI助手进驻TCL电视,加剧AI电视助手市场竞争。
DeepSeek推出升级开源模型DeepSeek-V3.1-Terminus,优化编程和搜索性能。Cursor上线全新文档中心提供学习资源。开源项目CookLikeHOC和阿里巴巴DeepResearch智能体发布,反映社区对实用AI工具的需求。
Today’s AI News
百度智能云千帆团队发布全新的视觉理解模型Qianfan-VL并完全开源。该系列提供3B、8B和70B三种尺寸以适应不同规模企业需求。模型具备多尺寸适配、智能推理能力(8B和70B版本可处理复杂图表理解、视觉推理及数学解题)以及优异的OCR专家能力,能精准识别手写体和复杂版面。该模型基于百度自研的昆仑芯P800完成训练。
Meta公司为Facebook Dating推出AI约会助手,旨在提升匹配精准度。该助手能理解用户需求并建议精准目标,提供个人资料优化和每周推荐一位"惊喜匹配对象”的浪漫邂逅功能。数据显示18-29岁用户匹配次数同比增长10%,但与Tinder的5000万日活相比仍有差距。行业正集体押注AI,Match Group投资与OpenAI合作推出AI功能,Bumble创始人预言AI未来或能进行"虚拟约会”。
阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni。该模型能统一处理文本、图像、音频和视频,支持119种文本语言和19种语音输入,并具备实时流式输出能力。在36项音频视频基准测试中,Qwen3-Omni在22项达到领先水平,表现与Gemini2.5Pro相当。
在Scale AI的SWE-BENCH PRO测试中,GPT-5、Claude Opus 4.1和Gemini 2.5表现不佳,最高正确率不足25%。测试刻意避用训练数据,GPT-5解题尝试准确率虽达63%,但未回答率高达63.1%,暴露其在复杂任务前的局限。测试涵盖1865个真实商业问题,显示AI在处理如JavaScript等语言时表现波动。
宇树科技发布G1人形机器人新视频,展示其强大的抗打击能力,遭飞踢、推撞后仍能保持平衡并自主起身完成空翻。机器人新增"反重力模式”提升稳定性,配备3指力控灵巧手和23-43个关节电机,售价9.9万元起。公司称其潜力可用于工业巡检、电力运维等重复性工作。
Google宣布其Gemini AI 助手正式进驻Google TV平台,首批支持设备为TCL QM9K 系列电视。用户可通过语音或遥控器唤醒助手,其能根据剧情细节、偏好类型智能推荐节目,回顾落下的剧集,并回答广泛问题推荐相关YouTube资源。三星、LG也宣布将引入微软Copilot AI 助手,加剧AI电视助手市场竞争。
DeepSeek正式推出升级版DeepSeek-V3.1-Terminus模型并宣布开源。新模型修复了语言不一致和异常字符问题,优化了编程和搜索智能体性能。在非智能体类测试中性能提升0.2%至36.5%,在HLE(人类终极测试) 上深度推理能力显著增强,在网页浏览、编程测试中亦有小幅提升。模型已在官方App、网页端及API平台同步更新。
AI编程工具Cursor上线全新文档中心,域名更新为cursor.com/docs,旨在提供更系统便捷的学习体验。改进包括提供从初学者到资深程序员的丰富学习资源,中文文档同步更新以方便中文用户,并预告即将推出全新品牌官网。中文用户可访问https://cursor.com/zh/docs获取资料。
开源项目CookLikeHOC引发关注,该项目系统整理了《老乡鸡菜品溯源报告》内容,旨在让用户在家复刻老乡鸡的标准化烹饪风味。该项目于2025年9月23日发布,社区热度达14,612星,展现了开源社区对实用美食文化工具的旺盛需求。
由阿里巴巴NLP团队打造的开源深度研究智能体DeepResearch(通义深智) 同日发布。该项目旨在利用AI辅助深度复杂研究工作,代表大模型在专业垂直领域应用的前沿探索。项目社区热度达13,834星,反映了对提升研究效率的AI工具的广泛兴趣。