Bubble's Brain 阅读手册 - 2025-11-07

AI资讯 2025/11/7

AI 日报

AI内容摘要

谷歌与Anthropic合作谈判引发关注，投资或使后者估值达3500亿美元。亚马逊亦投资140亿美元，AI领域竞争激烈，OpenAI估值达5000亿美元。  
马斯克xAI公司因收集员工生物数据训练虚拟伴侣引发争议，员工担忧隐私与滥用风险。MiniMax M2坚持全注意力机制，强调效果与基础设施挑战。  
小鹏科技日展示IRON机器人内部结构，构建智能生态。美团发布UNO-Bench基准测试，谷歌Gemini 3 Pro支持百万token，优化多模态推理。

Today’s AI News

最近，谷歌和人工智能初创公司Anthropic的合作谈判引发了科技圈的广泛关注。据悉，谷歌计划进一步增加投资，若交易达成，Anthropic的估值可能飙升至3500亿美元。Anthropic由前OpenAI员工于2021年创立，以其Claude系列大模型而闻名。谷歌此前已投资超过30亿美元并持有14%的股份，双方还在今年10月签署了一份价值数百亿美元的云计算协议，使Anthropic能够利用谷歌的100万个张量处理单元来增强其AI模型的能力。
然而，谷歌并非Anthropic唯一的支持者，亚马逊已投入140亿美元成为其最大股东。当前的AI领域竞争激烈，Anthropic与其主要竞争对手OpenAI正展开激烈角逐：Anthropic得到谷歌和亚马逊的支持，而OpenAI则与微软和英伟达结盟。上个月，Anthropic以1380亿美元的估值融资了130亿美元，而OpenAI通过股票交易将其估值推高至5000亿美元，这场竞争堪称资本实力的激烈较量。
近期，马斯克的AI公司xAI因要求员工提交自己的面部和声音数据以训练一个名为Ani的虚拟机器人女友而在内部引发了巨大争议。Ani是一个金色双马尾动漫形象，并提供成人内容选项，是xAI旗下SuperGrok订阅服务的一部分。公司律师在内部会议上表示，数据收集旨在使Ani更具"人性化”，但员工被要求签署永久授权书，允许公司在全球范围内无限制使用其生物信息，这引发了员工对于数据可能被用于深度伪造等滥用行为的担忧，并对其隐私感到不安。尽管存在争议，xAI仍坚持此为"工作必需”，并已推出了多款AI伴侣，包括AI男友Valentine、AI女友Mika和AI小熊猫Rudi等。
在众多AI模型致力于通过简化结构以节省计算资源的趋势下，MiniMax M2模型却坚持使用全注意力机制。团队负责人解释了这一决策的原因：首先，尽管线性注意力和稀疏注意力能够节省计算资源，但它们尚无法完全替代全注意力机制来处理现实世界中复杂的AI任务，如代码解析、数学计算和多模态数据处理，实际应用效果是关键。其次，团队认识到用户最关注的是效果、速度和成本，高效的模型需要顶级的工程优化配合，但目前评估体系不完善且观察成本高，创新面临挑战。最后，基础设施支持不足是主要障碍，针对线性和稀疏注意力的工具链稀缺，开发者需要自行构建。不过，团队在优化全注意力的同时，也在为未来的算力挑战进行技术储备。
在最近的小鹏科技日上，新一代IRON 机器人通过一场独特的"猫步”表演吸引了广泛关注。针对外界对机器人真实性的质疑，小鹏CEO何小鹏亲自通过"一镜到底”的视频展示了机器人的行走过程，并邀请研发团队现场打开机器人背部，公开展示其内部结构，以此回应技术实现的疑问。与此同时，小鹏已注册了多件"IRON”及"XPENG IRON”商标，覆盖广告销售、科学仪器等多个类别。结合其此前发布的飞行汽车和人形机器人项目，小鹏正加速构建"智能出行 + 智能形体”的完整生态矩阵，拓展智能科技的应用边界。
美团LongCat团队近日发布了创新的多模态大语言模型基准测试UNO-Bench，旨在系统评估模型在不同模态下的理解能力。该基准测试覆盖44种任务类型和5种模态组合，通过1250个全模态样本和2480个增强单模态样本，全面考察模型的单模态与全模态性能。UNO-Bench特别引入了多步骤开放式问题形式，并结合通用评分模型，能够自动评估六种题型，准确率高达95%。经过自动压缩处理后，数据集的运行速度提升了90%，为研究者提供了高效、可靠的评估工具。目前该测试主要聚焦中文场景，未来计划扩展至英语及多语言版本。
谷歌Gemini 3 Pro预览版已在其AI开发平台Vertex AI上出现，预计将于本月正式发布。这一新模型最引人注目的特点是支持高达100万token的上下文窗口，其标准层级支持20万token，高级层级则可扩展至百万级。作为Gemini 2.5的重大升级，Gemini 3 Pro专注于多模态推理和代理式智能，并在输入输出比率、图像/视频/音频处理比例等方面进行了全面优化。其训练数据已更新至2024年8月，预计在处理复杂任务方面表现将更加出色。这一突破性的上下文窗口扩展，将使模型在长文档分析、实时多媒体生成等领域发挥巨大作用，尤其对金融建模、生物科技模拟等企业级应用具有革命性意义。尽管谷歌尚未官方确认，技术社区普遍期待该模型在多模态创意生成和代码编写任务上超越现有标杆。