AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:多模态智能体×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
13:23
13:23Z.ai (智谱国际)@Zai_org
精选
GLM-5V-Turbo 技术报告发布,详细介绍了该模型在模型设计、多模态训练、强化学习、工具链扩展以及与智能体框架集成方面的主要改进。这些改进使模型在多模态编程、视觉工具使用和基于框架的智能体任务中表现出色。该报告旨在推动原生多模态智能体基础模型的发展,为构建更强大的 AI 智能体提供技术基础。
AI模型GLM-5V-Turbo多模态智能体强化学习工具链技术报告

推荐理由:做多模态智能体开发的团队可以看看 GLM-5V-Turbo 在工具链和框架集成上的设计思路,尤其是视觉工具使用和多模态编程的强化学习方案,值得参考。
原文
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月2日
10:52
10:52Google AI Developers@googleaidevs
在 Google I/O 大会后,Cerebral Valley 社区与 Google DeepMind 在旧金山举办了一场周末黑客松,开发者们利用最新的 Gemini 和 Gemma 能力,将多模态智能体、语音界面和长时推理系统等前沿概念转化为实际产品。获奖团队展示了 Gemini 3.5 Flash 在构建复杂 AI 应用中的潜力。此次活动体现了从技术发布到社区落地的快速转化,激励更多开发者探索 AI 的实用边界。
AI产品Gemini 3.5 Flash黑客松多模态智能体语音接口推理系统

推荐理由:想看看 Gemini 3.5 Flash 在真实场景中能跑多远?这场黑客松的获奖项目就是最好的参考——做多模态应用或语音交互的开发者值得关注这些实战案例。
原文
5月14日
19:09
19:09Google DeepMind@GoogleDeepMind
Google DeepMind 宣布了一项名为“AI 协同临床医生”的新研究计划,旨在探索多模态智能体如何更好地支持医护人员和患者。该计划聚焦于利用 AI 技术辅助临床决策、减轻医生负担,并提升患者护理质量。目前,团队已展示初步进展,但具体细节尚未完全公开。这一举措标志着 AI 在医疗领域从辅助工具向协作伙伴的演进。
AI产品多模态智能体医疗AIGoogle DeepMind临床辅助研究计划

推荐理由:医疗 AI 终于从“辅助”走向“协作”——多模态智能体有望真正减轻医护负担,做医疗 AI 或临床信息化的从业者值得关注。
原文
精选全部日报登录