AI资讯 2025/9/13
AI 日报
AI内容摘要
字节跳动与清华大学联合开源人体视频生成框架HuMo,支持多模态输入生成高质量视频。复旦大学中山医院发布医学教育大模型,集成四大智能助手培养有温度医生。支付宝推出AI智能皮肤检测和健康管家服务,优化用户健康管理体验。
腾讯会议结合AI元宝推出托管功能,自动记录并生成会议纪要。谷歌在AI搜索答案中嵌入广告,提升精准度优化体验。国家发改委宣布加大AI金融支持,完善风险分担机制推动民生应用。
MiniMax发布Music 1.5模型支持一键生成多种风格歌曲。Claude推出Web Fetch功能自动抓取网页内容处理。字节跳动发布Seedream 4.0支持4K分辨率和多图融合。蚂蚁集团推出MoE架构扩散语言模型LLaDA-MoE。Anthropic发布官方教程指导编写高效智能体工具。
Today’s AI News
字节跳动与清华大学联合推出开源框架HuMo(Human-Modal),专注于人体视频生成(HCVG)。该框架支持多模态输入(文本、图像、音频),可生成480P至720P清晰度、最长97帧的高质量视频,依托创新的数据处理流程、灵活的推理策略和渐进式训练方法,显著提升了生成质量和处理速度。
复旦大学附属中山医院发布医界智圣惠生智育双智教学大模型,通过人工智能重塑医学教育。系统集成四大智能助手:知识引擎智能体、智能培训智能体、教师助手智能体和智慧中枢智能体,旨在培养有温度、有能力的医生,提升教育精准度和效率。
支付宝推出AI智能皮肤检测功能,用户拍摄脸部照片即可获取肤质报告和个性化护理建议。蚂蚁AI健康管家AQ还提供多元健康检测、健康档案升级和老年专属服务(如"AI打假防骗专线”),全面优化健康管理体验。
腾讯会议推出AI托管功能,与腾讯元宝结合,帮助用户解决会议冲突和离场问题。AI可全程记录关键讨论和决策,并自动生成会议纪要,提升工作效率,革新传统会议模式。
谷歌推出"AI Mode”,在AI生成的搜索答案中嵌入广告,由AI Max工具支持。广告主可通过Google Ads创建高度契合用户意图的广告,提升精准度,优化搜索体验,目前处于全球beta测试阶段。
国家发改委宣布加大人工智能领域的金融和财政支持,完善风险分担和投资退出机制,推动AI在医疗、教育、交通、助残养老等民生领域的深度应用,充分发挥中国数据资源、产业体系和市场空间优势。
MiniMax发布Music 1.5模型,支持一键生成多种风格(包括中国传统乐器)的完整歌曲,提供高级模式精确控制歌曲结构,并向全球开发者开放API接口,服务于影视、游戏和短视频创作。
Claude推出Web Fetch功能,可自动抓取网页或PDF内容并进行深度处理,与Web Search联动生成带引用的专业报告,广泛应用于学术、商业、内容创作和教育领域。
字节跳动发布Seedream 4.0模型,支持原生4K分辨率和多图融合,具备强大的图像生成与推理能力,提供连续生图功能简化动画和视频制作,显著降低创作门槛。
蚂蚁集团与人大联合团队推出业界首个原生MoE架构的扩散语言模型 LLaDA-MoE,使用20T数据训练,激活参数1.4B,性能对标Qwen2.5-3B,推理速度更快,验证了扩散语言模型在代码、数学等结构化任务上的优势。
Anthropic发布官方教程,指导如何为智能体(Agent) 编写高效工具,强调迭代式、评估驱动的流程,包括构建原型、运行评估、与智能体协作,并遵循工具选择、命名空间设置、上下文返回、token优化和描述清晰等原则,以提升智能体任务完成能力。