Bubble's Brain 阅读手册 - 2025-09-30

AI资讯 2025/9/30

AI 日报

AI内容摘要

OpenAI推出Sora2应用与ChatGPT即时购物功能，转型应用平台与科技巨头竞争。Sora2采用垂直视频流，内容AI生成，内置身份验证应对肖像权问题。即时购物通过Etsy和Shopify合作，实现对话内直接购买，支付由Stripe处理。  
Anthropic发布Claude Sonnet 4.5模型，编码能力领先，并推出Imagine功能预演AI原生界面。模型优化对齐，采用安全框架，并推出Agent SDK支持开发者。寒武纪适配DeepSeek模型并开源推理引擎，提升计算效率。  
DeepSeek模型通过稀疏注意力机制降低成本，开放权重免费提供。蚂蚁开源Ring-flash-2.0模型，性能卓越，采用强化学习训练。OpenAI任命韩国业务负责人，布局全球市场。

Today’s AI News

OpenAI近期采取双线策略，正从技术提供商向应用平台转型。一方面推出类似TikTok的纯AI视频应用Sora2，另一方面在ChatGPT中整合即时购物功能，直接与科技巨头竞争。
Sora2应用设计酷似TikTok，采用垂直视频流与滑动浏览模式，所有内容均由AI生成，不支持用户上传外部视频。视频最长10秒，具备点赞、评论和"再创作”等社交功能，旨在让大众直观体验AI视频潜力，并抓住TikTok在美国前景未明的机遇，与Meta和谷歌展开竞争，同时内置身份验证以应对肖像权问题。
即时购物功能通过与Etsy和Shopify合作，用户可在ChatGPT对话中直接购买商品，无需跳转网站，支付由Stripe处理。该功能旨在将对话流量转化为实际交易，目前仅支持美国用户单件商品购买，未来计划扩展购物车和更多地区。消息公布后，Etsy和Shopify股价大幅上涨，显示市场看好其商业化前景。
Sora2默认使用版权内容，除非权利方主动"选择退出”，引发内容创作者和影视公司担忧。OpenAI拒绝"整包式”版权排除，要求逐一举报侵权，正值迪士尼等巨头提起诉讼，AI与知识产权的博弈进一步加剧。
Anthropic发布Claude Sonnet 4.5，在编码能力上登顶，并通过实验功能Imagine with Claude预演AI原生界面时代。在SWE-bench Verified测试中得分77.2%，被誉为全球最佳编码模型，逻辑推理、高级数学和多步骤任务表现出色，能自主运行超30小时处理复杂代理任务，模型规模更小但性能领先，定价保持不变。
Imagine功能仅向Max订阅用户开放5天，用户通过自然语言描述需求，AI实时生成UI元素和功能逻辑，不依赖预设代码，可动态创建完整应用并放置在桌面使用，引发AI原生操作系统讨论，挑战传统软件开发范式，但目前仍处实验阶段，存在延迟问题。
Anthropic优化模型对齐，减少不良行为，采用ASL-3安全框架过滤危险内容，并推出Claude Agent SDK，支持开发者构建自定义代理，集成VS Code等工具，提升开发体验。
寒武纪宣布成功适配DeepSeek-V3.2-Exp模型，并开源vLLM-MLU推理引擎，为AI行业注入新活力。利用Triton算子和BangC融合算子快速适配模型，提升计算效率，降低长序列数据处理成本，DeepSeek模型引入Sparse Attention机制增强复杂任务表现。
寒武纪开源vLLM-MLU代码，为开发者提供平台，推动AI技术普及和创新，项目地址已公开，鼓励社区参与，标志着AI软硬件生态的重大进展。寒武纪与DeepSeek合作预示AI技术新飞跃，应用场景将更丰富，为各行业带来便利和效率提升。
Anthropic发布Claude Code 2.0，带来多项革命性升级，包括检查点机制，AI能在长任务中自动保存状态，用户可随时回滚到上一个检查点，避免AI"失控”风险；原生VS Code插件集成到IDE侧边栏，提供内联差异预览和图形化交互，支持一键回滚；终端界面全面重设计，响应速度提升约3倍，减少卡顿问题。
Claude Code 2.0采用Claude Sonnet4.5模型，在OSWorld基准测试中得分高达61.4%，较前代提升近20个百分点，能自主运行超过30小时的连续编码任务，强化了工具协调能力，包括代码执行、文件创建和可视化支持。
DeepSeek推出创新模型，通过稀疏注意力机制大幅降低成本，采用闪电索引器对上下文窗口中的特定摘录进行优先级排序，以及细粒度标记选择系统从优先摘录中挑选关键标记，在长上下文操作中，API调用成本可降低多达一半，专注于提高基础Transformer架构的运行效率，模型开放权重并在Hugging Face上免费提供。
OpenAI任命前谷歌韩国区总监Kim Kyounghoon担任韩国业务负责人，Kim拥有超过20年的全球IT和咨询行业经验，将帮助OpenAI更好地理解和满足韩国市场的特定需求，标志着OpenAI在人才引进上的战略性布局。
蚂蚁百灵大模型团队开源高性能思考模型Ring-flash-2.0，基于Ling-flash-2.0-base深度优化，拥有100亿总参数，每次推理仅激活6.1亿参数，高效激活机制赋予强大计算能力并节省资源，在数学竞赛、代码生成和逻辑推理等高难度基准测试中表现卓越，性能超越同类40亿参数模型，媲美更大规模开源稀疏模型（MoE）及部分闭源高性能思考模型API。
Ring-flash-2.0采用创新两阶段强化学习（RL） 训练流程，包括轻量化长序列链式思考、可验证奖励训练和强化学习人类反馈，模型权重、强化学习训练方案和数据配方完全开源，为开发者和研究者提供宝贵资源，获取地址包括Hugging Face和ModelScope。