每日AI要闻【20250817】

AI快讯4周前发布 LHNav
47 0 0
🧠【Mureka V7.5 模型上线,AI 音乐创作水平再迎新高度】
⏰ 2025-08-17 | 来源:昆仑万维集团
📋 昆仑万维正式上线 Mureka V7.5 模型。该模型在中文歌曲创作上取得重大突破,提升了音色与演奏技法,优化了咬字和情感表现。通过 ASR 技术精准捕捉演唱细节,使 AI 演绎的歌曲更贴近真人演唱,显著增强了自然度和情感深度。
🌐 点击查看详情

 

🧠【消费级显卡就能跑的世界模型来了,腾讯混元 3D 世界模型推出 Lite 版本】
⏰ 2025-08-17 | 来源:腾讯混元
📋 腾讯混元 3D 世界模型 1.0 推出 Lite 版本,大幅降低显存开销,支持消费级显卡运行。该模型是业界首个开源可编辑的世界生成模型,用户可通过文本或图片输入生成可漫游的 3D 世界。Lite 版本采用动态 FP8 量化、SageAttention 量化及 Cache 算法优化,显存需求从 26GB 降至 17GB 以下,推理速度提升 3 倍以上。
🌐 点击查看详情

 

🧠【会记住你说的每句话:谷歌 AI Gemini App 上线记忆功能】
⏰ 2025-08-17 | 来源:IT 之家
📋 谷歌 Gemini AI 助手 App 新增 “记忆” 与 “临时聊天” 功能。开启 “记忆” 功能后,Gemini 可记住用户对话内容及偏好,实现更自然的交流,目前该功能已向部分国家或地区的 Gemini 2.5 Pro 用户开放,将在未来几周内推广至欧盟、英国、瑞士等地区的 Gemini 2.5 Flash 用户。
🌐 点击查看详情

 

🧠【Meta 视觉基座 DINOv3 王者归来:自监督首次全面超越弱监督,商用开源】
⏰ 2025-08-17 | 来源:机器之心
📋 Meta 推出并开源了 DINOv3,这是基于自监督学习的 SOTA 级视觉基础模型。DINOv3 在多个视觉任务中首次超越弱监督学习模型,训练数据量达 17 亿张图像,模型参数规模达 70 亿,其创新的自监督学习技术摆脱了对标注数据的依赖,降低了训练成本。
🌐 点击查看详情

 

🧠【智元推出首个机器人世界模型开源平台 Genie Envisioner】
⏰ 2025-08-17 | 来源:IT 之家
📋 智元机器人推出行业首个机器人世界模型开源平台 Genie Envisioner(GE)。GE 基于约 3000 小时真实机器人操控视频数据,整合未来帧预测、策略学习与仿真评估,形成闭环架构,使机器人实现从 “看” 到 “想” 再到 “动” 的端到端推理与执行。
🌐 点击查看详情

 

🧠【解锁任意模态模型训练,字节跳动 Seed 开源 VeOmni 框架】
⏰ 2025-08-17 | 来源:字节跳动 Seed
📋 字节跳动 Seed 团队开源了全模态 PyTorch 原生训练框架 VeOmni,推动全模态大模型的研究与应用。VeOmni 采用以模型为中心的分布式训练方案,将复杂的分布式并行逻辑与模型计算解耦,大幅降低工程开销,提升训练效率和扩展性。
🌐 点击查看详情

 

🧠【混元最新开源:Hunyuan – GameCraft,一张图,秒变游戏大片】
⏰ 2025-08-17 | 来源:腾讯混元
📋 腾讯混元开源新工具 Hunyuan – GameCraft,可将一张图片结合文字描述和动作指令生成高清动态游戏视频。该工具基于 HunyuanVideo 底模,支持第一人称跑酷、第三人称探险等多种场景,具备自由流畅的动作控制、记忆增强的历史一致性以及低成本生产优势。
🌐 点击查看详情

 

🧠【昆仑万维正式发布 Skywork Deep Research Agent v2】
⏰ 2025-08-17 | 来源:昆仑万维集团
📋 昆仑万维发布 Skywork Deep Research Agent v2,它是天工超级智能体的核心引擎。新版本首次整合多模态检索、理解和生成能力,推出 “多模态深度调研” Agent,可将图文信息完整整合到深度研究中,提升交付物质量。
🌐 点击查看详情

 

🧠【「Skywork UniPic 2.0」开源,统一多模态模型再迎新突破】
⏰ 2025-08-17 | 来源:昆仑万维集团
📋 昆仑万维正式开源「Skywork UniPic 2.0」模型,这是面向统一多模态建模的高效训练和推理框架。模型由生图编辑、统一模型能力和生图编辑后训练三个核心模块组成,具备生成模块轻量高效、引入强化学习提升性能和一体化灵活切换等核心优势。
🌐 点击查看详情

 

🧠【Anthropic 宣布 Claude Sonnet 4 支持高达 100 万 Token 的上下文窗口】
⏰ 2025-08-17 | 来源:AI 工具集
📋 Anthropic 宣布 Claude Sonnet 4 API 支持高达 100 万 Token 的上下文窗口,容量是之前的 5 倍。开发者可在单次请求中处理大型代码库或数十篇研究论文。
🌐 点击查看详情

 

✅ AI 大模型全栈教程与社群:https://www.yuque.com/lhyyh/ai
✅ 工信部 AIGC 证书:https://www.yuque.com/lhyyh/ai/ins6gx3o7hck7shb
✅ AI 工具集导航网站:https://tools.lhagi.com/
© 版权声明

相关文章

暂无评论

none
暂无评论...