AI资讯 2025/9/15
AI 日报
AI内容摘要
OpenAI拟调整与微软的收入分成协议,2030年降至8%,以应对AI计算开销。AI工具虚假信息率升至35%,Inflection模型表现最差。行业转向垂直专用模型,初创公司侧重任务定制化。
谷歌Gemini应用登顶美国免费榜,两周吸引2300万用户,展示移动端AI潜力。美团推出AI助手"小美”,基于自研模型支持语音点餐,但功能尚待优化。
EvolKV框架用进化算法优化KV cache,仅1.5%内存实现超模型性能。小红书发布FireRedTTS-2合成模型,支持多语言和音色克隆,自然度逼近真人。
Today’s AI News
OpenAI正计划调整与其重要投资方微软的收入分成协议,拟将微软的分成比例从目前的略低于20%逐步降至2030年的8%左右。这一变动预计将为OpenAI额外保留超过500亿美元的收入,主要用于应对庞大的AI计算开销。作为交换,微软将获得重组后OpenAI实体三分之一的股份,但不会进入董事会,双方还在就**通用人工智能(AGI)**等关键条款深入谈判。
一项由Newsguard进行的研究显示,主流生成式AI工具传播虚假信息的概率已从去年的18%飙升至35%,恶化与AI引入实时网络搜索功能密切相关。Inflection的模型表现最差,虚假信息率达56.67%;Perplexity错误率接近50%;ChatGPT和Meta的模型为40%;相对可靠的是Claude(10%)和Gemini(16.67%)。OpenAI承认模型存在"幻觉内容”问题,正研发新技术以提示不确定性。
AI行业正经历从"通用大模型”到"垂直专用”的战略转型,初创公司重心转向特定任务定制化模型和用户界面,将底层大模型视为可替换的"商品”。推动因素包括预训练边际收益递减,行业更关注后训练微调和强化学习。开源模型兴起加剧趋势,但巨头仍握有品牌、基础设施与资金优势,AGI在生物制药等领域的突破可能再次改变竞争格局。
谷歌Gemini应用凭借Nano Banana图像编辑模型在美国App Store免费榜登顶,支持多照片混合生成、风格迁移和对话式编辑,两周吸引2300万用户,工具使用超5亿次。免费用户每日可生成或编辑100张图片,付费用户(月费19.99美元起)额度为1000张,成功展示生成式AI在移动端的潜力,并带动谷歌其他应用排名上升。
美团推出首个AI Agent产品"小美”,通过语音指令帮助用户点餐,支持口味偏好学习和跨场景服务如酒店预订。技术基于自研Longcat模型(参数量5600亿)和本地生活垂直数据,但尚不能自动使用优惠券、处理复杂需求,且目前仅支持语音输入和文字回复,体验有待优化。
中国科学院大学和苏黎世联邦理工学院的研究者提出EvolKV框架,使用进化算法自适应分配KV cache预算,仅用1.5%的内存即实现超越完整模型的性能。在多项基准测试中表现优异,如Needle-in-a-Haystack提升13%,RULER提升3.6%,为降低大语言模型推理成本提供新思路。
小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2,解决灵活性差、发音错误多等问题,通过升级离散语音编码器和文本语音合成模型实现行业领先性能。模型支持多语言、音色克隆和流式解码,在客观和主观测评中均表现最优,仅需50小时录音即可定制音色,自然度逼近真人。
FireRedTTS-2采用双Transformer架构,包含1.5B参数Backbone Transformer和0.2B参数Decoder Transformer,支持低首包延迟和逐句生成。未来团队将优化模型,拓展说话人人数与语种,并解锁可控音效插入等功能,为AI播客和对话合成提供工业级解决方案。