Bubble's Brain 阅读手册 - 2025-09-15

AI资讯 2025/9/15

AI 日报

AI内容摘要

OpenAI拟调整与微软的收入分成协议，2030年降至8%，以应对AI计算开销。AI工具虚假信息率升至35%，Inflection模型表现最差。行业转向垂直专用模型，初创公司侧重任务定制化。  
谷歌Gemini应用登顶美国免费榜，两周吸引2300万用户，展示移动端AI潜力。美团推出AI助手"小美”，基于自研模型支持语音点餐，但功能尚待优化。  
EvolKV框架用进化算法优化KV cache，仅1.5%内存实现超模型性能。小红书发布FireRedTTS-2合成模型，支持多语言和音色克隆，自然度逼近真人。

Today’s AI News

OpenAI正计划调整与其重要投资方微软的收入分成协议，拟将微软的分成比例从目前的略低于20%逐步降至2030年的8%左右。这一变动预计将为OpenAI额外保留超过500亿美元的收入，主要用于应对庞大的AI计算开销。作为交换，微软将获得重组后OpenAI实体三分之一的股份，但不会进入董事会，双方还在就**通用人工智能（AGI）**等关键条款深入谈判。
一项由Newsguard进行的研究显示，主流生成式AI工具传播虚假信息的概率已从去年的18%飙升至35%，恶化与AI引入实时网络搜索功能密切相关。Inflection的模型表现最差，虚假信息率达56.67%；Perplexity错误率接近50%；ChatGPT和Meta的模型为40%；相对可靠的是Claude（10%）和Gemini（16.67%）。OpenAI承认模型存在"幻觉内容”问题，正研发新技术以提示不确定性。
AI行业正经历从"通用大模型”到"垂直专用”的战略转型，初创公司重心转向特定任务定制化模型和用户界面，将底层大模型视为可替换的"商品”。推动因素包括预训练边际收益递减，行业更关注后训练微调和强化学习。开源模型兴起加剧趋势，但巨头仍握有品牌、基础设施与资金优势，AGI在生物制药等领域的突破可能再次改变竞争格局。
谷歌Gemini应用凭借Nano Banana图像编辑模型在美国App Store免费榜登顶，支持多照片混合生成、风格迁移和对话式编辑，两周吸引2300万用户，工具使用超5亿次。免费用户每日可生成或编辑100张图片，付费用户（月费19.99美元起）额度为1000张，成功展示生成式AI在移动端的潜力，并带动谷歌其他应用排名上升。
美团推出首个AI Agent产品"小美”，通过语音指令帮助用户点餐，支持口味偏好学习和跨场景服务如酒店预订。技术基于自研Longcat模型（参数量5600亿）和本地生活垂直数据，但尚不能自动使用优惠券、处理复杂需求，且目前仅支持语音输入和文字回复，体验有待优化。
中国科学院大学和苏黎世联邦理工学院的研究者提出EvolKV框架，使用进化算法自适应分配KV cache预算，仅用1.5%的内存即实现超越完整模型的性能。在多项基准测试中表现优异，如Needle-in-a-Haystack提升13%，RULER提升3.6%，为降低大语言模型推理成本提供新思路。
小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2，解决灵活性差、发音错误多等问题，通过升级离散语音编码器和文本语音合成模型实现行业领先性能。模型支持多语言、音色克隆和流式解码，在客观和主观测评中均表现最优，仅需50小时录音即可定制音色，自然度逼近真人。
FireRedTTS-2采用双Transformer架构，包含1.5B参数Backbone Transformer和0.2B参数Decoder Transformer，支持低首包延迟和逐句生成。未来团队将优化模型，拓展说话人人数与语种，并解锁可控音效插入等功能，为AI播客和对话合成提供工业级解决方案。