AI资讯 2025/12/11
AI 日报
AI内容摘要
阿里云Qwen3-TTS升级,增加音色库并提升语音自然度。Meta扎克伯格接管AI商业化,2026年发布闭源模型Avocado。英特尔计划收购SambaNova,以增强其AI芯片产品线竞争力。
Adobe与ChatGPT深度合作,用户可通过自然语言直接编辑图片与PDF文件。Google更新AI搜索功能,增加来源链接以提升体验和回应担忧。汉语盘点2025公布年度字词候选名单。
阿里巴巴发布全模态大模型Qwen3-Omni-Flash,支持多模态输入与流式响应。前字节跳动潘欣加入美团负责多模态AI。阿里通义千问月活破3000万,四大生产力功能永久免费。
Today’s AI News
阿里云Qwen3-TTS语音合成模型迎来全面升级。新版本显著增加了音色库,提供超过49种高品质音色,覆盖不同性别、年龄和地域特征,并支持包括中文、英文、德语、法语在内的10种主要语言及多种方言。模型在语音自然度方面大幅提升,可根据文本内容自适应调节语速和韵律,拟人化程度接近真人。用户可通过简单易用的Qwen API接口轻松访问这一功能。
据内部确认,Meta首席执行官扎克伯格已接管公司AI商业化路线图,其新一代大模型**“Avocado”** 将于2026年春季以闭源形式发布,仅提供API及托管服务。该模型整合了谷歌Gemma、OpenAI gpt-oss及阿里通义千问等第三方开源成果进行训练,并计划使用新采购的英伟达H100芯片。此举标志着Meta将从"开源旗手”转向API、广告与云服务三重变现的商业策略。
英特尔已与AI芯片初创公司SambaNova Systems签署非约束性收购意向书,具体交易细节尚未公开。SambaNova的核心产品是面向大型模型推理的"可重构数据流单元”(RDU)芯片,具备高算力。市场关注点在于,若收购完成,英特尔将如何将SambaNova的技术整合进其现有AI产品线(如Habana Labs的Gaudi系列),以提升在AI加速芯片市场的竞争力。
Adobe 宣布与 ChatGPT 深度合作,用户可通过自然语言对话直接编辑 Photoshop、Acrobat 和 Adobe Express 等应用中的图片与 PDF 文件。该集成简化了操作流程,用户无需切换软件,即可完成如背景虚化、调整参数、压缩转换、合并 PDF 以及设计海报等任务,并能一键将项目转至 Adobe 原生应用进行深度编辑。
Google 对其 AI 搜索功能 “AI 模式” 进行更新,在 AI 生成的搜索结果中增加更多内嵌来源链接,并为链接提供 AI 生成的简短说明,以帮助用户理解其相关性。此次更新旨在提升搜索体验,并回应外界对 AI 搜索可能影响网站流量的担忧。Google 正与多家媒体合作试点,探索 AI 工具如何为新闻机构吸引受众。
“汉语盘点2025” 活动公布了年度字词候选名单。国内字候选包括"韧”“创”“融”“智”“通”,国内词候选包括"十五五”、”深度求索(DeepSeek)”、“九三阅兵”等。国际词候选中出现了”草台班子”、“地缘政治”等词汇。最终评选结果将于 12 月 19 日揭晓。
阿里巴巴Qwen团队发布了新一代全模态大模型Qwen3-Omni-Flash。该模型支持文本、图像、音频和视频的无缝输入与实时流式响应,可同步生成高质量文本与自然语音,语音自然度接近真人。它支持119种文本语言交互,并开放了System Prompt自定义权限,允许用户设定特定人设风格和表达偏好。在性能上,新模型在逻辑推理、代码生成和多模态理解等基准测试中均有显著提升。模型已通过API上线,定价为输入1元/百万tokens,输出3元/百万tokens,并已在Qwen Chat集成Demo。阿里计划在2025年Q1发布70B轻量版,Q2开放语音克隆接口,Q3上线视频驱动头像Beta功能。
前字节跳动视觉模型AI平台负责人潘欣已正式加入美团,负责多模态AI的创新工作。潘欣曾在谷歌大脑、百度、腾讯及字节跳动任职,拥有丰富的AI平台建设经验。他将主导LongCat App等多项多模态AI应用的开发。美团将AI视为提升核心竞争力的关键,其战略包括将AI应用于员工工作、改造现有产品服务以及大力投入自研大语言模型。2025年以来,美团已推出包括AI编程产品Nocode、大语言模型LongCat-Flash-Chat、视频生成模型LongCat-Video在内的多款AI基础模型和应用,并推出了”袋鼠参谋”、”智能掌柜”等面向餐饮商家的AI工具,展示了其在AI技术上的全面布局。
阿里通义千问宣布,其公测仅23天月活跃用户已突破3000万,并宣布将四大生产力功能永久免费开放。这四大功能包括:AI PPT,用户可通过自然语言对话生成并修改完整PPT;AI讲题,可拍照上传题目,提供解题思路、举一反三和薄弱点诊断;AI文库,提供覆盖多场景的5亿级资料库,支持智能挂载和下载;AI写作,可直接在聊天框中生成并按要求修改格式规范的文档。阿里此举旨在通过顶级模型能力和极致免费体验,占领高频生产力场景,将通义千问打造成AI时代的”超级入口”。
留言讨论