Bubble's Brain 阅读手册 - 2025-09-28

AI资讯 2025/9/28

AI 日报

AI内容摘要

英伟达CEO黄仁勋宣布向OpenAI投资1000亿美元，看好其成为万亿美元级科技巨头潜力。  
苹果发布Manzano图像模型，具备图像理解与生成双重能力，性能接近GPT-4o等商业系统。  
OpenAI CEO预测AGI将在2030年前实现，AI将接管30%-40%工作岗位，呼吁积极适应变革。

Today’s AI News

英伟达CEO黄仁勋最近透露了公司的重磅战略：向OpenAI投资高达1000亿美元！他强调，这并非合作的前提，而是看中了OpenAI成为下一个数万亿美元级科技巨头的潜力，认为其未来能与Meta、谷歌平起平坐。黄仁勋指出，随着AI推理能力的指数级提升，计算需求将暴增。他特别提到，现代AI已不再是单一模型作战，而是多模型协同工作，大大增强了思考和学习能力。英伟达将成为OpenAI自建AI基础设施的首选合作伙伴，助力其打造完整系统以支持客户增长。尽管市场对AI行业短期供给过剩有所担忧，但黄仁勋对行业长期发展充满信心，认为英伟达将继续引领这场技术革命。
苹果公司悄悄亮出了一张AI新牌——Manzano图像模型。这个模型的厉害之处在于，它同时具备图像理解和图像生成的双重能力，一举解决了当前许多开源模型"偏科”的难题。Manzano采用了一种创新的混合图像标记器，能输出两种类型的标记：连续标记（用于理解图像）和离散标记（用于生成图像）。这种设计减少了传统模型中理解与生成任务之间的冲突，使效率大幅提升。测试结果显示，Manzano在处理文本密集型任务（如阅读文件、解读图表）时表现出色，其能力已接近OpenAI的GPT-4o和谷歌的Nano Banana等商业系统。苹果为此模型构建了多种参数版本，最大达到30亿参数，性能随参数增加持续改善。除了经典的图像编辑，Manzano还能完成风格迁移、图像填充、深度估计等新任务。苹果认为，其模块化设计可能对未来的多模态AI发展产生深远影响。
OpenAI首席执行官萨姆・奥尔特曼近日抛出重磅预测：通用人工智能（AGI） 将在2030年前实现，并且这种"超级AI”将超越人类智慧。奥尔特曼预计，AI将接管30%到40% 的人类工作岗位。但他呼吁大家不必恐慌，指出技术迭代导致职业更替是历史常态——例如打字员、电话接线员等职业早已消失。AI的崛起是技术进步的一部分，将推动新工作形式的诞生，提升生产效率，创造新机会。他强调，未来的工作模式将是人类与AI紧密协作。面对变革，奥尔特曼鼓励企业积极利用AI提升竞争力，同时呼吁个人重视技能提升与终身学习，以适应新的经济环境。尽管预言引发广泛讨论，但奥尔特曼传递的核心信息是：以开放心态迎接AI带来的挑战与机遇。
一家名为 Friend 的 AI 创业公司最近在纽约地铁上演了一场"视觉轰炸”。他们投入了 超过100万美元，铺开了1.1万张车厢广告、1000个站台海报和130个城市广告牌，连西第四街站都被完全"包场”。CEO 阿维・施弗曼称这是"全球首个大规模的 AI 广告活动”，但他也坦言这是一场"巨大的赌博”，因为"剩下的钱不多了”。不过，这场豪赌并不被所有人买账。Friend 售价129美元的可穿戴 AI 设备因涉嫌 常态监控 而饱受争议，甚至被《连线》杂志作者公开吐槽为"我讨厌我的朋友”。不少广告还被网友恶搞，贴上了"监控资本主义”的标签，呼吁大家"去找真实的朋友”。有意思的是，施弗曼明知纽约人对 AI 反感度全美最高，却故意在广告中留白，试图引发公众讨论——结果讨论是有了，只是方向有点跑偏。
谷歌悄悄给自家的 Gemini 系列大模型 来了一次"性能升级”。最新版的 Gemini 2.5 Flash Lite 成为目前"最快的专有模型”，每秒能吐出887个 token，比之前快了40%。虽然还赶不上某些开源模型的"飙车速度”，但在质量和成本控制上表现亮眼。同时，Gemini 2.5 Flash 在处理多步骤任务时也更聪明了，在专业测试中的得分提升到54%。而 Flash Lite 更省"口水”，输出 token 减少了50%，适合高频应用场景。别忘了还有 Gemini Live 的语音助手升级，现在能更自然地和你聊天，反应也更灵敏。谷歌这一波操作，明显是想让开发者用得更爽、花得更少。
阿联酋总统穆罕默德和 OpenAI 的 CEO 山姆・奥特曼坐到了一起，谈的不是石油，而是 人工智能合作。这个石油富国正在疯狂投资 AI，打算建全球最大的 AI 数据中心之一，还要推出阿拉伯语 AI 模型，彻底向知识经济转型。值得注意的是，阿联酋还拉着美国一起搞事——今年5月就和前总统特朗普签了协议，计划在美国境外建全球最大的 AI 园区之一。这次和 OpenAI 牵手，显然是想借力打力，加速自己的科技转型战略。看来，未来 AI 的战场不止在硅谷，也在沙漠。
明星创业公司Thinking Machines发布了他们的第二篇研究论文，主题是 “模块化流形”。这项研究瞄准了一个核心问题：如何让庞大的神经网络训练起来更稳定高效。简单来说，想象一下训练AI模型就像教一个超级复杂的机器人学走路。如果机器人的关节（对应网络的权重、梯度等）活动幅度太大或太小，它就容易摔倒（训练不稳定）或者学得特别慢。这篇论文提出的新方法，相当于给机器人的每个关节都加上了"智能安全带”，确保它们都在合理的范围内活动。论文作者Jeremy Bernstein巧妙地将整个神经网络视为一个由多个小模块组合而成的几何结构（流形），并设计了一套统一的优化规则。实验显示，新方法在小规模测试中效果优于常用的AdamW优化器，虽然每一步稍慢一点，但稳定性显著提升。如果这套方法能成功应用到像GPT这样的大模型上，未来训练AI的效率和可靠性都将迈上新台阶。
腾讯混元3D团队带来了一个重磅成果：业界首个高质量原生3D组件生成模型。现在的3D生成AI通常会把一个物体（比如一把椅子）生成一个完整的、不可分割的模型。但在实际应用中，比如游戏开发或3D打印，我们往往需要的是可以拆分的"积木”——椅子的靠背、坐垫、腿最好能单独生成和编辑。腾讯的新模型Hunyuan3D-Part解决了这个问题。它包含两大核心技术：1. P3-SAM：一个能自动、精确地将3D模型"切分”成不同部件的分割模型。2. X-Part：一个能根据分割结果，生成高保真、结构合理的3D组件的生成模型。这意味着，未来游戏开发者可以更快速地创建能互动的3D资产（比如让汽车轮子真的能转），而3D打印爱好者则可以像玩高级积木一样，分部件打印再组装复杂模型。该模型在多项测试中大幅超越了现有方案，并且代码和模型均已开源。
近期，美国政府与埃隆·马斯克的人工智能公司xAI达成了一项合作协议。这一举动被外界视为特朗普与政府之间关系逐渐改善的一个信号。合作恰逢马斯克与特朗普在一次公开活动中会面，使得此事备受关注。xAI将支持美国政府在人工智能领域的研发项目，这有助于美国在激烈的全球AI竞争中保持优势。马斯克一直对AI的潜在风险发出警告，主张进行适度监管。此次合作也意味着科技巨头与政策制定者可能在AI的安全与发展方向上寻求更多共识，共同推动技术朝着可控、有益的方向前进。
谷歌旗下的DeepMind最近推出了一款全新的机器人AI模型，专门解决洗衣分类的麻烦。这款AI模型的核心能力是自动洗衣物分类。它通过深度学习和计算机视觉技术，能够快速分辨出不同衣物类型、颜色和材质。这项技术的实际应用场景非常直观：配备了这个AI的机器人，可以自动完成洗衣前的分类工作，这标志着人工智能在家务领域的又一次突破和机器人推理能力的显著提升。DeepMind表示，未来这项技术还能扩展到折叠衣物、清洁房间等更多家务任务中，为家庭生活的智能化转型打开了新思路。

AI资讯 2025/9/28

AI内容摘要

Today’s AI News

留言讨论