Bubble's Brain - 2025-12-11

AI资讯 2025/12/11

AI 日报

AI内容摘要

阿里云Qwen3-TTS升级,增加音色库并提升语音自然度。Meta扎克伯格接管AI商业化,2026年发布闭源模型Avocado。英特尔计划收购SambaNova,以增强其AI芯片产品线竞争力。
Adobe与ChatGPT深度合作,用户可通过自然语言直接编辑图片与PDF文件。Google更新AI搜索功能,增加来源链接以提升体验和回应担忧。汉语盘点2025公布年度字词候选名单。
阿里巴巴发布全模态大模型Qwen3-Omni-Flash,支持多模态输入与流式响应。前字节跳动潘欣加入美团负责多模态AI。阿里通义千问月活破3000万,四大生产力功能永久免费。

Today’s AI News

  1. 阿里云Qwen3-TTS语音合成模型迎来全面升级。新版本显著增加了音色库,提供超过49种高品质音色,覆盖不同性别、年龄和地域特征,并支持包括中文、英文、德语、法语在内的10种主要语言及多种方言。模型在语音自然度方面大幅提升,可根据文本内容自适应调节语速和韵律,拟人化程度接近真人。用户可通过简单易用的Qwen API接口轻松访问这一功能。

  2. 据内部确认,Meta首席执行官扎克伯格已接管公司AI商业化路线图,其新一代大模型**“Avocado”** 将于2026年春季以闭源形式发布,仅提供API及托管服务。该模型整合了谷歌GemmaOpenAI gpt-oss及阿里通义千问等第三方开源成果进行训练,并计划使用新采购的英伟达H100芯片。此举标志着Meta将从"开源旗手”转向API、广告与云服务三重变现的商业策略。

  3. 英特尔已与AI芯片初创公司SambaNova Systems签署非约束性收购意向书,具体交易细节尚未公开。SambaNova的核心产品是面向大型模型推理的"可重构数据流单元”(RDU)芯片,具备高算力。市场关注点在于,若收购完成,英特尔将如何将SambaNova的技术整合进其现有AI产品线(如Habana Labs的Gaudi系列),以提升在AI加速芯片市场的竞争力。

  4. Adobe 宣布与 ChatGPT 深度合作,用户可通过自然语言对话直接编辑 PhotoshopAcrobatAdobe Express 等应用中的图片与 PDF 文件。该集成简化了操作流程,用户无需切换软件,即可完成如背景虚化、调整参数、压缩转换、合并 PDF 以及设计海报等任务,并能一键将项目转至 Adobe 原生应用进行深度编辑。

  5. Google 对其 AI 搜索功能 “AI 模式” 进行更新,在 AI 生成的搜索结果中增加更多内嵌来源链接,并为链接提供 AI 生成的简短说明,以帮助用户理解其相关性。此次更新旨在提升搜索体验,并回应外界对 AI 搜索可能影响网站流量的担忧。Google 正与多家媒体合作试点,探索 AI 工具如何为新闻机构吸引受众。

  6. “汉语盘点2025” 活动公布了年度字词候选名单。国内字候选包括"韧”“创”“融”“智”“通”,国内词候选包括"十五五”、”深度求索(DeepSeek)”、“九三阅兵”等。国际词候选中出现了”草台班子”、“地缘政治”等词汇。最终评选结果将于 12 月 19 日揭晓。

  7. 阿里巴巴Qwen团队发布了新一代全模态大模型Qwen3-Omni-Flash。该模型支持文本、图像、音频和视频的无缝输入与实时流式响应,可同步生成高质量文本与自然语音,语音自然度接近真人。它支持119种文本语言交互,并开放了System Prompt自定义权限,允许用户设定特定人设风格和表达偏好。在性能上,新模型在逻辑推理、代码生成和多模态理解等基准测试中均有显著提升。模型已通过API上线,定价为输入1元/百万tokens,输出3元/百万tokens,并已在Qwen Chat集成Demo。阿里计划在2025年Q1发布70B轻量版,Q2开放语音克隆接口,Q3上线视频驱动头像Beta功能。

  8. 前字节跳动视觉模型AI平台负责人潘欣已正式加入美团,负责多模态AI的创新工作。潘欣曾在谷歌大脑、百度、腾讯及字节跳动任职,拥有丰富的AI平台建设经验。他将主导LongCat App等多项多模态AI应用的开发。美团将AI视为提升核心竞争力的关键,其战略包括将AI应用于员工工作、改造现有产品服务以及大力投入自研大语言模型。2025年以来,美团已推出包括AI编程产品Nocode、大语言模型LongCat-Flash-Chat、视频生成模型LongCat-Video在内的多款AI基础模型和应用,并推出了”袋鼠参谋”、”智能掌柜”等面向餐饮商家的AI工具,展示了其在AI技术上的全面布局。

  9. 阿里通义千问宣布,其公测仅23天月活跃用户已突破3000万,并宣布将四大生产力功能永久免费开放。这四大功能包括:AI PPT,用户可通过自然语言对话生成并修改完整PPT;AI讲题,可拍照上传题目,提供解题思路、举一反三和薄弱点诊断;AI文库,提供覆盖多场景的5亿级资料库,支持智能挂载和下载;AI写作,可直接在聊天框中生成并按要求修改格式规范的文档。阿里此举旨在通过顶级模型能力和极致免费体验,占领高频生产力场景,将通义千问打造成AI时代的”超级入口”。

留言讨论