AI 洞察日报 - 2025-09-07

AI资讯 2025/9/7

AI 日报

AI内容摘要

为解决AI幻觉问题,OpenAI改革评测体系引入扣分机制。
同时,阿里巴巴推出万亿参数新模型,英伟达则通过资本内循环巩固其主导地位。
此外,AI伴侣的社会接受度引关注,而版权诉讼则以巨额和解金暂告段落。

Today’s AI News

  1. 一项针对美国40岁以下年轻人的最新调查显示,大约 25% 的年轻人认为 AI 伴侣 有可能取代现实中的恋爱关系。尽管超过70%的人仍感不适,但已有约 11% 的人愿意拥有一个 AI 朋友。调查揭示了明显的"阵营”划分:性别差异上,男性比女性更接受AI伙伴;代际差异上,Z世代比千禧一代更保守;而在**“钞能力”差异方面,收入和学历越高的人排斥感越强。这表明,一个包含人机共建亲密关系**的新时代或许正在临近。

  2. 针对AI模型时常自信地编造错误信息的AI 幻觉现象,OpenAI发表论文坦白,其根源在于行业内的评测体系。在这种如同"应试教育”的体系下,AI为了在排行榜上获得高分,被训练成了”应试选手”,宁愿猜测也不愿承认无知。为解决此问题,OpenAI提出改革评测体系,引入"答错倒扣分”机制,并重组了其核心的模型行为团队,前负责人Joanne Jang将领导新成立的OAI Labs,探索新一代人机交互。此举标志着AI发展理念正从追求高分转向构建更诚实、可靠和值得信赖的系统。

  3. 阿里巴巴正式推出了其迄今最强大的模型——Qwen3-Max-Preview,总参数规模达到了惊人的1 万亿。这款模型能力强悍,尤其在编程方面表现卓越,被誉为"程序员福音”。在测试中,它不仅能解决复杂的数学竞赛图片题,还能一次性生成完美可运行的代码来制作交互式网页动画或开发扫雷游戏,完全无需反复沟通和"抽卡”。目前,这款强大的模型已通过通义APP和网页等多种方式提供免费体验,其更强的正式版也已在开发中。

  4. OpenAI的最新研究深入揭示了AI幻觉的成因。首先,AI的学习方式是基于海量数据练习预测下一个词,这让它擅长模仿语言模式,却无法辨别事实真伪,对无规律的随机信息只能靠"蒙”。其次,现有的AI评测体系如同只看准确率的考试,激励模型养成自信猜测的坏习惯,因为承认"不知道”会直接得零分。为解决此问题,OpenAI提出改革考试规则,引入答错扣分机制,对"自信的错误”进行更严厉的惩罚,同时对坦承不知的行为给予一定的鼓励分,从而引导AI从一个"爱面子的学霸”转变为"严谨的学者”。

  5. AI公司Anthropic因被指控从盗版网站下载约700万本书来训练其AI模型Claude,最终以高达15亿美元的和解金了结了作家们的集体诉讼。这笔创纪录的赔偿金虽然看似是作家的胜利,但也被视为科技公司"先污染,后治理”策略的又一次成功。这笔罚款对于近期融资130亿美元、估值千亿的Anthropic而言仅是业务开销。更重要的是,和解避免了法庭对"使用受版权保护的作品训练AI是否构成‘合理使用’”这一核心法律问题做出裁决,为其他面临类似诉讼的AI公司提供了用金钱解决问题的范例,预示着AI与版权的博弈远未结束。

  6. 芯片巨头英伟达上演了一场精妙的资本内循环大戏,宣布斥资15亿美元向小型云服务商Lambda租赁搭载了英伟达自家芯片的服务器。这一"左手倒右手”的操作分为三步:首先,英伟达投资像Lambda这样的潜力公司;接着,这些公司用投资款向英伟达购买大量昂贵的AI芯片,直接增加英伟达的自身收入;最后,英伟达再以大客户身份租回这些服务。此举不仅让小公司的财报变得亮眼,为未来上市铺路,也使英伟达成为其股东并缔结了强大的生态联盟,以此对抗科技巨头自研芯片的趋势,牢牢稳固了自己在AI时代的主导地位