Bubble's Brain 阅读手册 - 2025-09-18

AI资讯 2025/9/18

AI 日报

AI内容摘要

DeepSeek团队论文登《Nature》封面，成为首个通过同行评审的大语言模型，强化学习显著提升推理能力。Irregular完成8000万美元融资，其模拟环境技术用于AI安全评估。Invisible Technologies获1亿美元融资，提供AI培训数据服务。腾讯推出Parallel-R1框架和SRPO技术，分别提升数学推理和图像真实感。谷歌Gemini2.5在ICPC竞赛获金牌，攻克人类未解问题。GPT-5通过OpenRouter平台提供优惠，YouTube升级AI功能助力创作者。OpenAI任命新财务主管，迪士尼等起诉MiniMax侵犯著作权。智源研究院开源InfoSeek数据集，CodeRabbit完成融资优化代码审查。DeepMind与OpenAI在编程挑战中竞争，自我反思式RAG系统提升检索准确性。中国叫停采购英伟达芯片，或加速国产替代方案发展。

Today’s AI News

DeepSeek 团队的研究论文登上《Nature》封面，成为首个通过权威同行评审的大语言模型，彰显了 DeepSeek R1 的技术实力。论文核心亮点在于创新的推理能力训练方法，采用强化学习（RL） 实现自我演化，显著提升模型表现，例如在AIME2024数学竞赛中准确率从15.6%跃升至71.0%。
AI安全评估公司 Irregular 完成8000万美元融资，由红杉资本和红点创投领投，估值达4.5亿美元。其核心创新是模拟环境技术，通过构建复杂网络环境让AI扮演攻击者和防御者，提前识别潜在风险，SOLVE漏洞检测框架在行业广泛应用。
旧金山初创公司 Invisible Technologies 完成1亿美元融资，由Vanara Capital领投，估值突破20亿美元。公司致力于为企业提供AI培训数据，帮助构建有效工作流程，其软件平台包括五大模块，其中 Expert Marketplace 提供特定领域专家支持定制化训练与数据标注。
腾讯 AI Lab 推出 Parallel-R1 强化学习框架，教会AI同时探索多条推理路径，通过简单提示生成高质量数据、渐进式课程训练和交替奖励策略，在数学基准测试中准确率平均提升8.4%，AIME25测试中实现42.9%的飞跃。
腾讯混元团队推出 SRPO（语义相对偏好优化） 技术，解决AI生成图像皮肤"油光”问题，通过语义相对偏好优化和 Direct-Align 策略提升真实感，训练效率极高，仅10分钟超越现有方法，真实度和美学评分提升超三倍。
谷歌 Gemini 2.5 Deep Think 在2025年国际大学生程序设计竞赛（ICPC）中成为首个获得金牌的AI，解决10道题，成绩排名第二，并独自攻克人类未解的问题C，技术突破包括预训练、后训练、高级强化学习和多步逻辑推理。
Macroscope 获3000万美元A轮融资，总融资额达4000万美元，产品通过AI驱动的理解引擎自动分析代码库，解决开发者的代码管理和团队协作痛点，采用订阅制，每位开发者每月30美元。
AI推理公司 Groq 完成7.5亿美元融资，估值达69亿美元，为超过200万开发者和财富500强企业提供快速、低成本的计算服务，其LPU和GroqCloud平台成为美国AI技术栈的关键部分。
GPT-5 通过 OpenRouter 平台限时5折优惠，输入令牌低至0.625美元/百万个，输出令牌5美元/百万个，在AIME2025数学测试中拿下94.6%的高分，支持40万令牌输入和12.8万令牌输出，适合高强度计算任务。
YouTube 升级AI功能，向所有合作伙伴计划创作者开放面部相似性检测技术，推出Ask Studio AI聊天机器人助手，升级灵感标签页和A/B测试功能，并测试唇形同步技术改善自动配音，构建更完善的创作者生态系统。
OpenAI 任命前xAI财务主管 Mike Liberatore 为新商业财务主管，负责管理和扩大快速增长的数据中心和基础设施财务，公司近期估值达5000亿美元，与甲骨文签署3000亿美元云计算协议。
迪士尼、华纳兄弟、环球影业 起诉中国AI独角兽 MiniMax，指控其通过海螺AI服务侵犯著作权，未经授权使用知名电影角色进行AI训练和商业化，要求返还侵权所得并请求法定损害赔偿，可能引发AI版权诉讼潮。
北京智源人工智能研究院开源首个面向深度研究的数据集 InfoSeek，采用 “扩散-回溯”数据合成方法，包含5万条高质量训练样本，基于其训练的3B参数模型在BrowseComp-Plus基准测试中取得16.5%的准确率，性能接近商业模型。
YouTube 为Shorts创作者推出生成式AI工具，包括 Veo3Fast 文本转视频模型、动作迁移功能、艺术风格化、语音转歌曲混音工具和智能剪辑功能，目前已在美国、英国、加拿大、澳大利亚和新西兰部分市场推出。
AI代码审查初创公司 CodeRabbit 完成6000万美元B轮融资，估值达5.5亿美元，由 Scale Venture Partners 领投，NVentures 和 CRV 跟投，平台能有效识别代码错误，减少审查人力需求，年经常性收入超1500万美元，服务超过8000家公司。
DeepMind 和 OpenAI 在编程挑战中展开竞争，DeepMind解决10/12的问题，OpenAI实现12/12的完美通关，展示AI在复杂逻辑任务上的突破。
自我反思式RAG系统 推出，通过文档智能评估、智能检索决策和自我纠错机制提升检索准确性，基于Langchain + GROQ实现，减少AI幻觉，提高回答相关性。
中国叫停科技企业采购 英伟达AI芯片，可能源于技术自主性与供应链安全考量，或将加速国产替代方案的研发与落地，反映全球AI硬件竞争的白热化。