Bubble's Brain - 2026-05-19

AI资讯 2026/5/19

AI 日报

AI内容摘要

腾讯混元等机构发布Chronicles-OCR古文字评测基准,测试发现大模型视觉感知准确率仅27.1%。谷歌AI Studio移动应用上线支持无代码开发。腾讯云两款模型月底结束免费公测。月之暗面获国资20亿美元融资,Anthropic更新Claude Design套餐。

今日AI新闻

  1. 视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源 腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,正式推出了"Chronicles-OCR”,这是业界首个完整覆盖汉字"七体之变”演化轨迹的中国古文字感知评测基准。该数据集由领域专家进行多层级交叉标注,包含 2800 张严格平衡的高质量图像,针对甲骨文、金文、篆书等古早字体采用单字级精细标注,对隶、楷、行、草等成熟字体则采用保留原始阅读顺序的序列级转写。项目团队设计了四个层层递进的核心任务,将大模型的"视觉感知”与"语义推理”解耦开来,在对包括GPT-5、Gemini 3.1 Pro、Claude Opus 4.7在内的28个主流多模态大语言模型进行评测后,结果令人大跌眼镜:在端到端检测任务中全军覆没,细粒度识别最高准确率仅27.1%,且开启推理模式反而放大感知不确定性。评测还发现,视觉大模型更容易去识别载体的纹理材质,而非判别微观的笔画风格,这意味着顶尖AI模型仍未做到真正"读懂”中国传统古文字。

  2. Google AI Studio 移动应用正式登陆 Google Play,支持预注册 谷歌正式推出AI Studio独立移动应用,已在Google Play商店上线并开放预注册,标志着其Gemini驱动的AI开发平台从桌面端扩展至移动设备。用户可通过语音或文字输入描述想法,AI即可自动生成原型、创建专业图标并设计界面,无需编程基础即可制作个性化膳食规划器、会议笔记工具或聚会游戏等实用小程序。核心功能包括:社区画廊与一键Remix、后台构建与进度通知、手机与桌面项目无缝同步,以及生成的应用可通过链接跨平台即时分享。该应用在Google I/O大会前夕推出,体现了谷歌推动AI工具普惠化的战略意图,行业分析认为将激发移动端AI创意工具的爆发式增长。

  3. 免费公测进入倒计时:腾讯云两大主力AI模型月底转入正式商用 腾讯云官方发布公告,其智能体开发平台中的两款核心大模型Hy3previewDeepSeek-V4-Pro,将于2026年5月27日10:00正式结束限时免费公测,全面转向商业化运营服务,公测结束后将根据实际模型调用量进行按量计费。平台采用"平台按月/按年订阅服务 + 增购资源包”的组合计费模式,基础套餐划分免费版、Skill Plan版、专业版及企业版四个梯度,月费从0元到4880元不等,其中免费版仅限每个账号首次领取并体验一个月,年付订阅专业版或企业版可享低至8.33折优惠。此外,当业务量激增时可选择增购预付费资源包,提供从1万PU到1000万PU不等的四种规格,售价在10元至10000元之间,有效期长达12个月,系统会优先抵扣原有套餐包资源后再动用预付费资源包。

  4. 国资入场!月之暗面新一轮 20 亿美元融资步入尾声 国内大模型独角兽月之暗面(Kimi) 股东名单迎来重大变更,新增国智投、北京人工智能基金等国资机构及中国移动。其近期进行的20亿美元融资已进入收尾阶段,半年内累计融资额超39亿美元,估值较去年11月翻了4倍有余。技术层面,基于Kimi K2.5模型的编程工具Composer 2.5已集成至Cursor,同时开源的Kimi K2.6模型在代码编写和智能体能力上实现全面升级。

  5. 加量不加价!Anthropic 宣布 Claude Design 套餐上限翻倍 Anthropic 宣布对其生产力工具进行重大升级:视觉创作工具 Claude Design 在所有订阅套餐中的 Token 上限提升一倍;开发工具 Claude Code 的快速模式默认切换至新一代模型 Opus4.7,响应速度最高提升至2.5倍。Opus4.7在快速模式下的定价与 Opus4.6 保持一致,且两款模型共享速率限制池,无需额外成本。

  6. AI创业一年狂揽800亿美元!Anthropic反杀OpenAI,双雄独吞89% The Information数据显示,全球34家头部AI创业公司年化收入达800亿美元,半年暴涨112%,但 OpenAIAnthropic 两家独吞89%。Anthropic 年化收入在15个月内从10亿美元飙升至300亿美元以上,反超 OpenAI 的250亿美元。Anthropic 押注企业客户,Claude Code 半年实现10亿美元年化收入;而 OpenAI 依赖ChatGPT的9亿周活用户。剩下32家公司仅分得11%的份额,头部效应形成自我强化的飞轮。分析指出,AI产业链中最大价值正回流至模型厂,应用层公司高收入背后大部分成本仍需交给底层模型和算力。

  7. 全球首个AI专家市场上线,让数字分身7x24小时变现 2026年5月19日,全球首个AI专家市场「袋袋」(Profy)正式上线。它允许用户通过自然对话或CLI模式,将个人专业知识封装成数字分身,并在市场上架,实现7x24小时自动变现。袋袋解决了底层技术、算力和支付等难题,用户无需懂提示词或编程。专家经验封装后,可赋能团队或上架市场供人雇佣,收益归专家所有。买家则可按需雇佣AI专家,获得专业级交付物。该平台已成功帮助投资人Selene和品牌公关专家宫琼实现认知资产化和高效变现。袋袋的背后是未来式智能(Agentspro.cn),其技术包括多智能体编排专业行为本体图谱等,并具备「IP黑盒保护」及「全自动自进化」能力,确保专家经验安全增值。

  8. 港中大、浙大研究:当前AI Agent的"记忆”只是"备忘录” 香港中文大学与浙江大学联合发布论文,指出当前AI Agent的记忆系统本质上是"备忘录”而非"真记忆”。主流记忆方案(如向量存储、RAG等)的核心是"查找”而非"记忆”,缺乏将经验抽象为规则的泛化能力。研究归纳了三大结构性缺陷:信息量不等于能力(模型权重不变,无法发展专业知识)、泛化天花板(检索式记忆处理组合式新任务需指数级案例,增大上下文窗口无效)、以及记忆投毒的安全漏洞(注入成功率高达98.2%)。论文基于神经科学的"互补学习系统理论”,主张应构建双系统架构,在保留"海马体”(快速记录)的同时,增加"新皮层”(缓慢整合写入权重)的异步巩固通道,才能使Agent真正"学习”而非仅"记录”。

  9. 英伟达发布Vera CPU,专为Agentic AI打造 英伟达近日宣布其首款专为Agentic AI设计的定制CPU——Vera已成功向多家顶级AI公司发货,标志其进入量产阶段。Vera搭载88个自研奥林巴斯核心,内存带宽达1.2TB/s,性能较前代Grace CPU提升50%。英伟达副总裁已将首批系统交付给Anthropic、OpenAI、SpaceX AI和甲骨文等公司,各公司均表示期待通过Vera优化工作负载并提升推理效率。甲骨文计划从2026年起部署数十万颗Vera CPU。此外,英伟达还计划在几天内发布Vera Rubin平台,Vera CPU将与Rubin GPU集成,为Agentic AI时代提供强大计算架构。

  10. 全球 AI 市场:OpenAI 与 Anthropic 独占 89% 年收入份额 科技媒体 The Information 对全球 34 家主流 AI 公司的调查显示,AI 市场收入正加速向头部集中。OpenAI 与 Anthropic 表现强势,两家合计斩获整条赛道约 89% 的年化营收。34 家 AI 初创公司总年收入已逼近 800 亿美元,半年内实现 112% 的爆发式增长,但绝大部分利润被两大巨头牢牢攥在手中。Anthropic 年化营收预计将在今年 6 月底飙升至 50 亿美元,远超年初的 10 亿美元。OpenAI 今年 3 月底月营收已达 20 亿美元,折合年化营收 240 亿美元,但需向微软分成 20% 的营收。尽管 Perplexity、ElevenLabs 等应用层明星也表现不俗,年销售额跨过 5 亿美元门槛,但背后存在隐忧——它们每年需向 OpenAI 和 Anthropic 支付数十亿美元模型接入费用。这种依赖并存的生态格局,让底层模型供应商拥有极强话语权,全球 AI 产业正演变为双雄并立的持久战。

  11. AI 大模型加速落地文旅场景 豆包正式上线"博物馆讲解模式” 在第 50 个国际博物馆日之际,字节跳动旗下 AI 应用豆包正式上线博物馆讲解模式,通过生成式