Bubble's Brain 阅读手册 - 2025-10-23

AI资讯 2025/10/23

AI 日报

AI内容摘要

AI视频生成竞争白热化，Sora推出角色客串功能，豆包则实现首尾帧智能补全，提升创作可控性。
与此同时，特斯拉聚焦于无人驾驶与人形机器人，而谷歌的量子芯片则实现了可验证的量子计算优势。
AI正加速应用落地，微软为照片应用增添创作工具，谷歌推出免费学习平台，资本也转向应用领域。

Today’s AI News

你的电脑相册现在自带"魔法棒”了！微软给自家平平无奇的Photos（照片）应用注入了灵魂，推出了两大AI新功能，不过目前只有最新的Copilot+ 电脑用户能尝鲜。第一招叫Restyle Image（图像重新设计），能给你的照片一键套上艺术滤镜，且AI会聪明地只修改背景和氛围，避免把你的脸P得六亲不认，你还能通过"创意级别”滑杆掌控AI的介入程度。第二招是Image Creator（图像创建），你只需用文字描述画面，AI就能从零开始为你绘画，让输入文字 → 输出视觉内容成为现实。微软强调会严格遵守隐私保护协议，不会窃取用户数据，旨在将"照片”应用从相册管理员升级为一个智能创作平台。
面对"增收不增利”的业绩，特斯拉CEO马斯克将公司未来的赌注押在了现实世界人工智能上。随着号称"史上最重大更新之一”的FSD14.1版本推送，他对全无人驾驶（FSD）的信心大增，并宣布专为无人出租车服务设计的Cybercab将于明年第二季度投产。另一张王牌是人形机器人 Optimus，外观更逼真的第三代Optimus（V3）预计明年第一季度亮相，马斯克认为其市场潜力将超越汽车，并计划为此打造一个从零件到代码的机器人产业链闭环。他还半开玩笑地解释称，希望拥有更大的投票控制权是为了有效指挥未来的"机器人大军”。
谷歌量子计算团队再次在顶级期刊**《自然（Nature）》上发表重磅成果，其最新的Willow量子芯片成功实现了全球首个可验证的量子优势**——它不仅算得快，还能证明自己算得对。在一项复杂计算任务中，Willow芯片仅用2.1小时就完成了目前全球最快超级计算机Frontier需要3.2年才能解决的难题，速度快了近13,000倍。更重要的是，它运行的Quantum Echoes（量子回声）算法能直接模拟微观世界，有望成为新药研发和新材料探索的终极模拟器。这项基于诺奖级量子调控与超导量子电路理论的突破，标志着量子计算正从理论迈向实际应用。
国产AI视频模型Hailuo 2.3即将上线，目标直指全球顶尖水平。该模型能根据文字生成长达10秒钟的高清（1080p）视频，演示中甚至达到了影院级的8K画质。此次升级专注于提升细节表现力，无论是人物细腻的面部表情还是流畅的动作捕捉都达到了新高度，并大幅改善了运动稳定性和物理一致性，解决了AI视频常见的抖动和闪烁问题。这一切得益于其独家的NCR架构。官方还计划提供免费试用，预示着一场AI视频创作的狂欢即将来临。
OpenAI的Sora则选择了一条更具娱乐性和社交性的路线，推出了多项新功能。其中最亮眼的是**“角色客串”功能，允许用户将自家的宠物、玩具，甚至是他人视频中的角色，引入到自己生成的视频中担任主角，并配套推出了"热搜榜”来展示最受欢迎的客串角色。此外，Sora还增加了基础视频编辑工具**，承诺减少过度审核以给予创作者更多自由，并计划推出私人和社区频道。Android版本也已在开发中，旨在将Sora从一个技术工具转变为一个人人可参与的社交游乐场。
谷歌正式推出了名为Google Skills的免费学习平台，堪称是将顶尖的AI教育资源普惠大众。这个"AI在线大学”的课程内容由DeepMind、Google Cloud和Gemini模型研发团队等谷歌内部最强大脑打造。平台强调**“动手学习”，提供真实的云环境实验室，并内置Gemini Code Assist编程助手提供实时指导。学员完成课程后不仅能获得全球认可的官方认证**，还能进入与150多家合作企业对接的人才库，谷歌几乎零成本地为学习者铺平了从技能学习到就业的完整道路。
生数科技的Vidu Q2视频大模型以其超高的稳定性著称，现已全面开放API接口，邀请所有开发者共同创作。该模型尤其擅长在视频中保持稳定的角色和商品形象，还能通过捕捉细微表情为AI角色注入情感。其MaaS（模型即服务）模式能为动漫等行业提供"降本增效”的解决方案，快速生成高质量分镜。新版本还支持生成长达5分钟的视频，并提供了丰富的节日特效模板，让每个用户都能轻松体验专业级的特效制作。
火山引擎的豆包视频生成模型（Seedance 1.0 pro）推出了一项名为“首尾帧能力”的创新功能，教AI学习如何当"导演”。用户只需设定视频的开始和结束画面，AI便能智能推理并补全中间所有符合物理逻辑和叙事节奏的连贯动作。这项技术极大地提升了AI视频的可控性，确保主角在复杂场景中不会"画风突变”，从而让创作者能够精准引导叙事，创作出更具沉浸感的故事。
在AI工具创新热潮中，科技巨头Meta正对其AI部门进行一场深刻的战略重塑，计划裁员约600人。此举旨在减少官僚作风，提升团队决策效率和活力。值得注意的是，由新主管Alexandr Wang领导的新部门TBD Lab并未受到影响，反而在持续扩张，显示出扎克伯格对新AI路线的全力支持。这场变革背后也传出包括图灵奖得主Yann LeCun在内的元老级人物与新管理层存在分歧。总而言之，Meta的目标是打造一个更精简、高效的AI战队，以应对未来的激烈竞争。
豆包编程最近的升级成为了"编程小白”的福音，旨在彻底拆除编程的高门槛。其新增的创作模式，允许用户通过简单的手绘草图或参考图，就能让AI自动搭建出网页框架。而对于专业程序员，问答模式则像一位不知疲倦的技术导师，随时提供代码调试、重构等帮助。其核心目标是让零基础的用户也能轻松玩转开发。
资本市场的风向正在转变，AI应用公司LiblibAI近期获得高达1.3亿美元的融资，这是目前国内AI应用领域最大的一笔单笔投资，标志着AI投资已进入**“应用为王”的时代。LiblibAI的成功在于其打造的“工具+社区生态”**模式，汇聚了大量创作者进行交流与共创。获得巨额融资后，公司计划打造一个全球化的多模态内容生态，并将产品升级为"AI专业创作工作室”，重点发力视频生成领域。
昆仑万维旗下的SkyReels视频生成平台也宣布全新版本即将上线，其目标是让每个人都能当"导演”。该产品持续在长视频生成、角色一致性等硬核技术上取得突破，从能控制微表情的V1模型，到实现"无限时长”生成的V2模型，再到能用声音驱动数字人说话的A3模型，SkyReels正一步步推动AI视频创作平民化，旨在让普通人也能轻松创作出专业水准的视频大片。

AI资讯 2025/10/23

AI内容摘要

Today’s AI News

留言讨论