AI 洞察日报 - 2025-09-16

AI资讯 2025/9/16

AI 日报

AI内容摘要

上海AI Lab推出Lumina-DiMOO多模态模型,采用全离散扩散架构,实现文字、图片、声音在共享语义空间高效交互与生成。腾讯云全面开放AI能力并适配国产芯片,通过软硬件协同全栈优化支持高效运行AI。字节跳动与港大推出Mini-o3开源视觉推理模型,支持数十轮深度对话推理,在高难度视觉任务中达到顶尖水平。微软为商业用户免费提供Copilot AI助手,支持Word、Excel、PPT等办公场景智能辅助。OpenAI推出原生音频评估功能,无需转文本即可直接测试语音模型,简化流程并提升评估准确性。OpenAI重启机器人研究,聚焦传感与原型设计,探索通用机器人开发。昆仑万维Mureka推出Agent Studio音乐创作功能,用户通过文字描述自动生成歌词、曲风与人声。OpenAI发布编程专用模型GPT-5-Codex,可独立工作超7小时,支持多模态输入与长时任务处理。Anthropic发布LLM Agent工具开发指南,基于Model Context Protocol提出三步迭代流程与五大设计原则。Grok AI推出Grok4Fast超快响应模式,为订阅用户提供近实时复杂问题处理能力。Genspark推出首款本地开源模型浏览器,支持离线运行169款开源模型。GitHub开源项目system-prompts-and-models-of-ai-tools发布,整合多款AI工具的系统提示词、内部工具与模型。

Today’s AI News

  1. 上海AI Lab推出Lumina-DiMOO多模态模型,该模型采用全离散扩散架构,实现文字、图片、声音在共享语义空间的高效交互与生成,显著提升多模态理解与图像生成能力。

  2. 腾讯云全面开放AI能力并适配国产芯片,通过软硬件协同全栈优化支持主流国产芯片高效运行AI,同时积极参与开源,推动AI技术普惠化。

  3. 字节跳动与港大推出Mini-o3开源视觉推理模型,支持数十轮深度对话推理,依托VisualProbe数据集迭代数据收集流程,在高难度视觉任务中达到顶尖水平。

  4. 微软为Microsoft 365商业用户免费提供Copilot AI助手,支持Word、Excel、PPT等办公场景的智能辅助,付费版还可使用GPT-5技术实现跨文件分析与图像生成。

  5. OpenAI推出原生音频评估功能,无需转文本即可直接测试语音模型,简化流程并提升评估准确性,同步提供开发者Cookbook指南助力快速应用。

  6. OpenAI重启机器人研究,聚焦传感与原型设计,以远程操作和模拟训练探索通用机器人开发,加速AGI实现进程。

  7. 昆仑万维Mureka推出Agent Studio音乐创作功能,用户通过文字描述即可自动生成歌词、曲风与人声,覆盖热点写歌、情感表达等六大场景,大幅降低音乐创作门槛。

  8. OpenAI发布编程专用模型GPT-5-Codex,可独立工作超7小时,支持多模态输入与长时任务处理,节省93.7%的tokens,集成CLI、IDE与GitHub,提升开发效率与安全性。

  9. Anthropic发布LLM Agent工具开发指南,基于Model Context Protocol提出三步迭代流程与五大设计原则,开源工具评估Cookbook支持开发者构建高效AI助手。

  10. Grok AI推出Grok4Fast超快响应模式,为订阅用户提供近实时复杂问题处理能力,显著提升交互速度,平衡效率与深度分析需求。

  11. Genspark推出首款本地开源模型浏览器,支持离线运行169款开源模型,集成智能体比价、Autopilot自主浏览与MCP扩展功能,提供无广告纯净体验。

  12. GitHub开源项目system-prompts-and-models-of-ai-tools发布,整合多款AI工具的系统提示词、内部工具与模型,获85,252星关注,助力开发者社区协作与创新。