AI资讯 2025/9/27
AI 日报
AI内容摘要
谷歌团队开发神经操作系统原型,界面可实时生长和动态生成,实现机器适应人。
斑马智行联合阿里高通推出全球首个全模态端侧大模型实车方案Auto Omni,计划2026年量产。
DeepMind发布机器人AI模型,能分类衣物并推理,GitHub Copilot CLI公测版扩展AI编程助手至命令行。
滴滴公测AI出行助手小滴,支持复杂需求推荐,OpenAI推出GDPval基准测试评估AI行业表现。
蚂蚁数科发布隐私保护AI框架Gibbon,京东物流推出超脑模型和异狼机械臂系统提升物流效率。
Gemini系列模型升级,包括成本降低和工具能力提升,AI在多个领域推动人机协作与自动化。
Today’s AI News
Google团队利用Gemini 2.5 Flash-Lite模型开发了一个实验原型,探索**“神经操作系统”。该系统的界面能根据用户操作实时生长和动态生成**,而非固定不变。其核心亮点包括:即时生成新界面显示操作结果、记住上下文以提供更贴合的交互、逐步渲染带来流畅自然的体验。未来应用可能包括自动生成比价工具或个性化时间建议界面,目标是从"人适应机器”转变为机器实时适应人。
在2025云栖大会上,斑马智行联合阿里通义与高通推出了全球首个全模态端侧大模型实车方案——Auto Omni,相当于为汽车装上能更智能理解环境的 “AI大脑” 。该方案是三方独家合作成果,已与多家国内顶尖车企合作,计划于2026年实现量产。斑马智行还发起了 “AI车载平台服务联盟” ,背后是阿里巴巴3800亿元的AI基础设施投入,并已率先接入全模态模型Qwen3-Omni。
谷歌DeepMind发布了一款新型机器人AI模型,其主打技能是给洗衣物分类。该模型通过深度学习和计算机视觉技术,能准确识别衣物的颜色、材质和款式,标志着机器人在日常推理能力上取得进展。这项技术未来有望扩展到折叠衣物、打扫房间等更多家务场景,使智能机器人更接近成为真正的家庭助手。
GitHub推出了GitHub Copilot CLI公测版,将其AI编程助手能力延伸至命令行界面。它作为一个全能AI代理,能理解代码上下文和GitHub生态,支持开发者使用自然语言指令完成写代码、调试、重构、发布版本等全流程任务,标志着Copilot从"代码建议工具”升级为 “全栈执行助手” 。目前该功能面向GitHub Copilot Pro、Pro+、Business或Enterprise付费用户开放。
谷歌DeepMind推出了Gemini Robotics 1.5双AI机器人系统,其核心突破在于让机器人学会”思考”。该系统采用推理和执行分离的设计:Gemini Robotics-ER1.5(思考模型) 负责分析环境并制定步骤计划;Gemini Robotics 1.5(执行模型) 负责将计划转化为具体动作。这种设计旨在让机器人摆脱单一任务束缚,向通用化迈出重要一步。
滴滴正式公测了其AI出行助手"小滴Beta v0.8版本”。用户可通过升级后的滴滴App使用语音或文字向"小滴”表达复杂出行需求(如考虑价格、车辆空间和实时路况),助手会结合多维度信息智能推荐最多3个匹配方案。同时,滴滴上线了MCP服务,允许AI开发者将滴滴打车能力集成到自己的AI智能体中,推动AI更深融入实际生活。
OpenAI发布了名为 GDPval 的新基准测试,用于评估AI模型在关键行业中的表现是否逼近人类专家。测试覆盖对美国GDP贡献最大的九个行业中的44种职业。结果显示,GPT-5-high版本在40.6%的任务中表现优于或持平人类专家,而Anthropic的 Claude Opus 4.1 达到49%的胜出率。OpenAI强调此测试旨在探索AI进步,未来将开发更全面的评估体系,助力人机协作。
蚂蚁数科发布了隐私保护AI训练框架 Gibbon,旨在解决跨机构数据联合建模中的隐私与效率矛盾。该技术采用安全两方训练方式,使梯度提升决策树模型训练速度提升2到4倍;在推理阶段,基于 同态查找表 的技术将推理效率提升了超过100倍。该成果已获国际顶级会议收录,并融入蚂蚁数科的隐私计算产品矩阵,为金融、营销等场景提供高效安全的数据协作支持。
京东物流发布了 超脑大模型2.0 和 异狼具身智能机械臂系统,标志着物流行业进入 “具身执行” 时代。超脑大模型2.0作为智能决策中心,能快速解决复杂物流优化问题并实时监控异常。异狼机械臂具备视觉识别和高精度抓取能力,拥有 自主学习 进化功能,已在全国多个京东园区投入24小时运行。这套"云端智能+终端执行”的闭环系统有效提升了作业效率,推动了智慧供应链发展。
OpenAI推出的 GDPval评估体系 是一项革命性的经济价值衡量工具,覆盖9大行业、44种职业,涉及3万亿美元经济价值和1320个高度专业化任务。在由平均14年从业经验的行业专家进行的盲测中,Claude Opus 4.1 和 GPT-5 等顶尖模型在部分任务中表现出接近或超越人类专家的水平,完成任务的速度是人类的100倍,成本仅1%。这预示着AI可能成为超越传统要素的第四种生产要素,人机协作将重塑工作模式。
Google DeepMind同日宣布对Gemini 2.5系列进行升级:Gemini 2.5 Flash-Lite 输出更简洁且成本降低50%;Gemini 2.5 Flash 的工具使用能力提升,在复杂任务中表现更优;同时引入了 -latest模型别名 以方便开发者自动使用最新版本。