AI资讯 2025/9/18
AI 日报
AI内容摘要
DeepSeek团队论文登《Nature》封面,成为首个通过同行评审的大语言模型,强化学习显著提升推理能力。Irregular完成8000万美元融资,其模拟环境技术用于AI安全评估。Invisible Technologies获1亿美元融资,提供AI培训数据服务。腾讯推出Parallel-R1框架和SRPO技术,分别提升数学推理和图像真实感。谷歌Gemini2.5在ICPC竞赛获金牌,攻克人类未解问题。GPT-5通过OpenRouter平台提供优惠,YouTube升级AI功能助力创作者。OpenAI任命新财务主管,迪士尼等起诉MiniMax侵犯著作权。智源研究院开源InfoSeek数据集,CodeRabbit完成融资优化代码审查。DeepMind与OpenAI在编程挑战中竞争,自我反思式RAG系统提升检索准确性。中国叫停采购英伟达芯片,或加速国产替代方案发展。
Today’s AI News
DeepSeek 团队的研究论文登上《Nature》封面,成为首个通过权威同行评审的大语言模型,彰显了 DeepSeek R1 的技术实力。论文核心亮点在于创新的推理能力训练方法,采用强化学习(RL) 实现自我演化,显著提升模型表现,例如在AIME2024数学竞赛中准确率从15.6%跃升至71.0%。
AI安全评估公司 Irregular 完成8000万美元融资,由红杉资本和红点创投领投,估值达4.5亿美元。其核心创新是模拟环境技术,通过构建复杂网络环境让AI扮演攻击者和防御者,提前识别潜在风险,SOLVE漏洞检测框架在行业广泛应用。
旧金山初创公司 Invisible Technologies 完成1亿美元融资,由Vanara Capital领投,估值突破20亿美元。公司致力于为企业提供AI培训数据,帮助构建有效工作流程,其软件平台包括五大模块,其中 Expert Marketplace 提供特定领域专家支持定制化训练与数据标注。
腾讯 AI Lab 推出 Parallel-R1 强化学习框架,教会AI同时探索多条推理路径,通过简单提示生成高质量数据、渐进式课程训练和交替奖励策略,在数学基准测试中准确率平均提升8.4%,AIME25测试中实现42.9%的飞跃。
腾讯混元团队推出 SRPO(语义相对偏好优化) 技术,解决AI生成图像皮肤"油光”问题,通过语义相对偏好优化和 Direct-Align 策略提升真实感,训练效率极高,仅10分钟超越现有方法,真实度和美学评分提升超三倍。
谷歌 Gemini 2.5 Deep Think 在2025年国际大学生程序设计竞赛(ICPC)中成为首个获得金牌的AI,解决10道题,成绩排名第二,并独自攻克人类未解的问题C,技术突破包括预训练、后训练、高级强化学习和多步逻辑推理。
Macroscope 获3000万美元A轮融资,总融资额达4000万美元,产品通过AI驱动的理解引擎自动分析代码库,解决开发者的代码管理和团队协作痛点,采用订阅制,每位开发者每月30美元。
AI推理公司 Groq 完成7.5亿美元融资,估值达69亿美元,为超过200万开发者和财富500强企业提供快速、低成本的计算服务,其LPU和GroqCloud平台成为美国AI技术栈的关键部分。
GPT-5 通过 OpenRouter 平台限时5折优惠,输入令牌低至0.625美元/百万个,输出令牌5美元/百万个,在AIME2025数学测试中拿下94.6%的高分,支持40万令牌输入和12.8万令牌输出,适合高强度计算任务。
YouTube 升级AI功能,向所有合作伙伴计划创作者开放面部相似性检测技术,推出Ask Studio AI聊天机器人助手,升级灵感标签页和A/B测试功能,并测试唇形同步技术改善自动配音,构建更完善的创作者生态系统。
OpenAI 任命前xAI财务主管 Mike Liberatore 为新商业财务主管,负责管理和扩大快速增长的数据中心和基础设施财务,公司近期估值达5000亿美元,与甲骨文签署3000亿美元云计算协议。
迪士尼、华纳兄弟、环球影业 起诉中国AI独角兽 MiniMax,指控其通过海螺AI服务侵犯著作权,未经授权使用知名电影角色进行AI训练和商业化,要求返还侵权所得并请求法定损害赔偿,可能引发AI版权诉讼潮。
北京智源人工智能研究院开源首个面向深度研究的数据集 InfoSeek,采用 “扩散-回溯”数据合成方法,包含5万条高质量训练样本,基于其训练的3B参数模型在BrowseComp-Plus基准测试中取得16.5%的准确率,性能接近商业模型。
YouTube 为Shorts创作者推出生成式AI工具,包括 Veo3Fast 文本转视频模型、动作迁移功能、艺术风格化、语音转歌曲混音工具和智能剪辑功能,目前已在美国、英国、加拿大、澳大利亚和新西兰部分市场推出。
AI代码审查初创公司 CodeRabbit 完成6000万美元B轮融资,估值达5.5亿美元,由 Scale Venture Partners 领投,NVentures 和 CRV 跟投,平台能有效识别代码错误,减少审查人力需求,年经常性收入超1500万美元,服务超过8000家公司。
DeepMind 和 OpenAI 在编程挑战中展开竞争,DeepMind解决10/12的问题,OpenAI实现12/12的完美通关,展示AI在复杂逻辑任务上的突破。
自我反思式RAG系统 推出,通过文档智能评估、智能检索决策和自我纠错机制提升检索准确性,基于Langchain + GROQ实现,减少AI幻觉,提高回答相关性。
中国叫停科技企业采购 英伟达AI芯片,可能源于技术自主性与供应链安全考量,或将加速国产替代方案的研发与落地,反映全球AI硬件竞争的白热化。