AI 洞察日报 - 2025-09-30

AI资讯 2025/9/30

AI 日报

AI内容摘要

OpenAI推出Sora2应用与ChatGPT即时购物功能,转型应用平台与科技巨头竞争。Sora2采用垂直视频流,内容AI生成,内置身份验证应对肖像权问题。即时购物通过Etsy和Shopify合作,实现对话内直接购买,支付由Stripe处理。  
Anthropic发布Claude Sonnet 4.5模型,编码能力领先,并推出Imagine功能预演AI原生界面。模型优化对齐,采用安全框架,并推出Agent SDK支持开发者。寒武纪适配DeepSeek模型并开源推理引擎,提升计算效率。  
DeepSeek模型通过稀疏注意力机制降低成本,开放权重免费提供。蚂蚁开源Ring-flash-2.0模型,性能卓越,采用强化学习训练。OpenAI任命韩国业务负责人,布局全球市场。

Today’s AI News

  1. OpenAI近期采取双线策略,正从技术提供商向应用平台转型。一方面推出类似TikTok的纯AI视频应用Sora2,另一方面在ChatGPT中整合即时购物功能,直接与科技巨头竞争。

  2. Sora2应用设计酷似TikTok,采用垂直视频流与滑动浏览模式,所有内容均由AI生成,不支持用户上传外部视频。视频最长10秒,具备点赞、评论和"再创作”等社交功能,旨在让大众直观体验AI视频潜力,并抓住TikTok在美国前景未明的机遇,与Meta谷歌展开竞争,同时内置身份验证以应对肖像权问题。

  3. 即时购物功能通过与EtsyShopify合作,用户可在ChatGPT对话中直接购买商品,无需跳转网站,支付由Stripe处理。该功能旨在将对话流量转化为实际交易,目前仅支持美国用户单件商品购买,未来计划扩展购物车和更多地区。消息公布后,Etsy和Shopify股价大幅上涨,显示市场看好其商业化前景。

  4. Sora2默认使用版权内容,除非权利方主动"选择退出”,引发内容创作者和影视公司担忧。OpenAI拒绝"整包式”版权排除,要求逐一举报侵权,正值迪士尼等巨头提起诉讼,AI与知识产权的博弈进一步加剧。

  5. Anthropic发布Claude Sonnet 4.5,在编码能力上登顶,并通过实验功能Imagine with Claude预演AI原生界面时代。在SWE-bench Verified测试中得分77.2%,被誉为全球最佳编码模型,逻辑推理、高级数学和多步骤任务表现出色,能自主运行超30小时处理复杂代理任务,模型规模更小但性能领先,定价保持不变。

  6. Imagine功能仅向Max订阅用户开放5天,用户通过自然语言描述需求,AI实时生成UI元素和功能逻辑,不依赖预设代码,可动态创建完整应用并放置在桌面使用,引发AI原生操作系统讨论,挑战传统软件开发范式,但目前仍处实验阶段,存在延迟问题。

  7. Anthropic优化模型对齐,减少不良行为,采用ASL-3安全框架过滤危险内容,并推出Claude Agent SDK,支持开发者构建自定义代理,集成VS Code等工具,提升开发体验。

  8. 寒武纪宣布成功适配DeepSeek-V3.2-Exp模型,并开源vLLM-MLU推理引擎,为AI行业注入新活力。利用Triton算子BangC融合算子快速适配模型,提升计算效率,降低长序列数据处理成本,DeepSeek模型引入Sparse Attention机制增强复杂任务表现。

  9. 寒武纪开源vLLM-MLU代码,为开发者提供平台,推动AI技术普及和创新,项目地址已公开,鼓励社区参与,标志着AI软硬件生态的重大进展。寒武纪与DeepSeek合作预示AI技术新飞跃,应用场景将更丰富,为各行业带来便利和效率提升。

  10. Anthropic发布Claude Code 2.0,带来多项革命性升级,包括检查点机制,AI能在长任务中自动保存状态,用户可随时回滚到上一个检查点,避免AI"失控”风险;原生VS Code插件集成到IDE侧边栏,提供内联差异预览和图形化交互,支持一键回滚;终端界面全面重设计,响应速度提升约3倍,减少卡顿问题。

  11. Claude Code 2.0采用Claude Sonnet4.5模型,在OSWorld基准测试中得分高达61.4%,较前代提升近20个百分点,能自主运行超过30小时的连续编码任务,强化了工具协调能力,包括代码执行、文件创建和可视化支持。

  12. DeepSeek推出创新模型,通过稀疏注意力机制大幅降低成本,采用闪电索引器对上下文窗口中的特定摘录进行优先级排序,以及细粒度标记选择系统从优先摘录中挑选关键标记,在长上下文操作中,API调用成本可降低多达一半,专注于提高基础Transformer架构的运行效率,模型开放权重并在Hugging Face上免费提供。

  13. OpenAI任命前谷歌韩国区总监Kim Kyounghoon担任韩国业务负责人,Kim拥有超过20年的全球IT和咨询行业经验,将帮助OpenAI更好地理解和满足韩国市场的特定需求,标志着OpenAI在人才引进上的战略性布局。

  14. 蚂蚁百灵大模型团队开源高性能思考模型Ring-flash-2.0,基于Ling-flash-2.0-base深度优化,拥有100亿总参数,每次推理仅激活6.1亿参数,高效激活机制赋予强大计算能力并节省资源,在数学竞赛、代码生成和逻辑推理等高难度基准测试中表现卓越,性能超越同类40亿参数模型,媲美更大规模开源稀疏模型(MoE)及部分闭源高性能思考模型API。

  15. Ring-flash-2.0采用创新两阶段强化学习(RL) 训练流程,包括轻量化长序列链式思考、可验证奖励训练和强化学习人类反馈,模型权重、强化学习训练方案和数据配方完全开源,为开发者和研究者提供宝贵资源,获取地址包括Hugging Face和ModelScope。