01:25elvis@omarsar0Vercel推出的eve agentic框架将所有组件(工具、技能、评估)以文件形式管理。它专为TypeScript开发者设计,能快速搭建智能体应用。该框架强调效率和简洁性,受到早期用户好评。AI产品eveVercelTypeScript智能体开发工具推荐理由:Vercel这个eve框架把agent的工具、技能和评估全做成文件,用TypeScript就能快速上手,适合想搞智能体开发的程序员。原文
01:12The Rundown AI@therundownai45岁保安咳血就医,常规检查未发现问题。AI系统EchoNext自动扫描其心电图,标记出严重心脏损伤。患者被召回后检测发现心脏泵血仅10%,且存在瓣膜泄漏,诊断为罕见遗传病。EchoNext已获FDA批准,将免费嵌入医疗聊天机器人OpenEvidence,后者已被约半数美国医生使用。AI产品EchoNextOpenEvidenceFDA医疗AI心电图诊断推荐理由:纽约时报报道的真实案例:EchoNext从心电图中找出致命心脏病,救了人。这AI已获FDA批准,还免费集成到OpenEvidence里,覆盖近半美国医生。原文
01:10Milvus@milvusio精选Milvus 尝试跳过压缩步骤,直接在文档完整 embedding list 上建立 HNSW 图索引。该方法在 TREC-COVID 上 nDCG@10 达 0.98,远超 MUVERA、LEMUR 等方法的 0.87-0.89。端到端检索中 TREC-COVID 分数 0.516 与 BruteForce 完全持平,MS MARCO 上 0.957 接近精确上限的 0.966。但构建成本显著增大:MS MARCO 平均长度 87 时耗时 6 倍,TREC-COVID 长度 236 时达 18 倍。对于 ColQwen2 等每文档含 5143 个 patches 的长向量,该方法成本过高无法实用。实验揭示当前近似策略的质量损失主要源自向量压缩步骤而非 HNSW 索引本身。AI模型HNSWMilvus嵌入列表索引向量检索近似搜索推荐理由:Milvus 把 embedding 列表直接塞进 HNSW,质量几乎追上暴力搜索,比 MUVERA 高了一截,但成本也翻了 6-18 倍,长文档还不支持。适合对精度有极致需求的项目。原文
01:09Philipp Schmid@_philschmid自 Google I/O 大会发布以来,开发者使用 Google AI Studio 已创建超过 100 万个原生 Android 应用。这一数据由 AI Studio 团队通过社交平台公布,展示了该工具在移动端开发中的快速普及。Google AI Studio 提供直接生成 Android 应用的能力,降低了开发门槛。目前该平台仍在持续迭代中。AI产品Google AI StudioAndroidGoogle I/O应用开发推荐理由:Google AI Studio 上线后已经有超过 100 万原生 Android 应用被创建,想快速生成 App 可以试试这个工具。原文
01:08OpenAI Blog(博客/媒体)GPT-5 Pro协助免疫学家Derya Unutmaz破解了持续3年的T细胞行为之谜,为癌症和自身免疫疾病研究提供新线索。该模型通过分析复杂免疫数据,识别出此前未知的T细胞激活模式。研究成果被OpenAI以案例形式发布,展示了大模型在基础科学中的应用潜力。AI模型GPT-5OpenAI免疫学T细胞科研应用9 个信源在谈推荐理由:OpenAI用GPT-5 Pro帮科学家搞定了3年没解的免疫难题,不是画饼是真能干活,科研党可以看看怎么用的。原文
01:06techcrunch@Rebecca BellanAnthropic 发布了 Claude Tag,这是一个始终在线的 Slack 集成 AI 队友。该功能通过持续读取 Slack 消息来积累组织语境、机构知识和企业工作流。Claude Tag 旨在提升团队协作效率,同时为 Anthropic 捕获企业级数据以优化模型。与一次性问答不同,它基于长期上下文提供更精准的协助。AI产品ClaudeAnthropicSlack企业协作智能体10 个信源在谈推荐理由:Anthropic 让 Claude 彻底融入 Slack,持续学习你们公司内部的知识和流程,不只是回答问题,更像一个真队友。原文
01:02LMSYS Org (SGLang)@lmsysorg79°与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA8 个信源在谈推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。原文
01:01LMSYS Org (SGLang)@lmsysorg精选Krea 2 是由 Krea AI 推出的开源文本到图像模型,在独立评测机构 Artificial Analysis 上排名第一。它包含两个版本:RAW 为未蒸馏基座检查点,适合微调和 LoRA 训练;Turbo 为 8 步蒸馏检查点,实现快速高质量生成。用户可在 RAW 上训练 LoRA,在 Turbo 上进行推理,并已获得 SGLang 的 Day-0 支持。AI模型Krea 2SGLangRAWTurbo图像生成推荐理由:Krea 2 开源了双版本,RAW 用来训练 LoRA,Turbo 跑推理,直接用 SGLang 就能跑,比闭源模型更灵活。原文
01:00AWS Machine Learning Blog@Yuan Tian这篇博客展示如何用Amazon Bedrock AgentCore构建一个对话式蛋白质研究助手。它通过自然语言解析提取结构化搜索参数,基于蛋白质语言模型进行向量相似性搜索。搜索结果会自动生成AI科学摘要,无需手动编码查询逻辑。整个过程涵盖查询解析、向量检索和摘要生成三步。技巧Amazon Bedrock蛋白质研究智能体RAG推荐理由:想建一个能聊蛋白质研究的智能助手?这篇教程用Bedrock AgentCore教你搞定,自动解析问题、向量搜蛋白质,还能生成摘要。原文
00:57AK@_akhaliqPlanBench-XL是一个新基准,专门评估LLM工具使用智能体在包含数千个工具的大型生态系统中的长程规划能力。该基准通过构建复杂任务链,要求智能体在工具选择、参数传递和结果融合中做出多步决策。初步测试中,GPT-4和Claude 3.5等主流模型在PlanBench-XL上的平均成功率低于40%,暴露了当前模型在规划深度和工具协调上的局限。AI模型PlanBench-XLLLM智能体工具使用长程规划推荐理由:想看看你用的LLM在多工具长流程场景下到底多靠谱?PlanBench-XL用上千个工具设计了真实任务链,测出来主流模型成功率不到40%,值得一测。原文
00:54Harrison Chase@hwchase17精选新论文提出Self-Harness方法,让智能体自动改进其harness。流程分三步:1/弱点挖掘,从执行轨迹中发现失败模式;2/harness提案,基于发现生成修改方案;3/提案验证,通过回归测试筛选有效提案。该方法基于DeepAgents框架,论文见arxiv.org/pdf/2606.09498。实验在多个基准上显示性能持续提升。论文Self-HarnessDeepAgentsLangChain智能体论文推荐理由:这篇论文让AI智能体自己学会改进工具链,三步流程从找问题到验证,基于DeepAgents框架,适合做Agent开发的人看看。原文
00:33Philipp Schmid@_philschmid精选71°这篇指南由 Google AI Studio 发布,帮助开发者上手 Gemini Interactions API。它通过 `previous_interaction_id` 实现对话链式衔接,演示了如何启用和处理 streaming 响应。指南还展示了执行本地函数调用的完整循环,并介绍了在远程沙箱中运行 Antigravity Agent 的方法。技巧Gemini Interactions APIGoogle智能体工具调用推荐理由:Google 官方出的 Gemini 交互 API 教程,从 streaming 到 agent 沙箱都有代码示例,想写多轮工具调用可以看这个。原文
00:30Meta Engineering Blog(博客/媒体)精选Meta 的工程团队为 Ray-Ban Meta 和 Oakley Meta Vanguards 智能眼镜设计了超窄电池,使其能装入镜腿内。通过定制电池形状和优化封装工艺,电池在有限空间内提供了足够电力以驱动摄像头、扬声器和 AI 任务。该设计解决了传统智能眼镜续航短、体积大的痛点,实现了功能与外观的平衡。AI产品MetaRay-Ban MetaOakley Meta Vanguards智能眼镜电池技术推荐理由:Meta 把电池塞进了眼镜腿里,这个工程细节很硬核。想了解智能眼镜怎么做到既轻又能跑 AI,就看这篇。原文
00:27Paul Couvert@itsPaulAitrylatitude 是一款开源监控工具,可实时追踪 AI Agent 的 Token 消耗与成本。它兼容 Anthropic、OpenAI 等模型,支持监控 Agent 的失败和对话聚类。该工具帮助公司将 Agent 对话数据转化为可分析的资产。AI产品trylatitudeAnthropicOpenAI智能体开源工具10 个信源在谈推荐理由:cesar.wtf 发了个开源工具 trylatitude,能精确看到你 AI agent 的 token 花在哪了,还兼容 Anthropic 和 OpenAI,比自己写日志好用多了。原文
00:24elvis@omarsar0Prime Intellect发布博客,介绍在GLM-5模型上运行大规模强化学习(RL)所需的基础设施组件,包括数据管道、训练调度和分布式计算。文章详细解释了如何用1万亿token训练RL智能体,并开源部分工具链。该方法旨在降低自改进智能体的开发门槛。技巧GLM-5Prime Intellect强化学习智能体基础设施推荐理由:想自己搞RL训练?这份Prime Intellect的博客手把手告诉你需要哪些基础设施,连GLM-5上的1T token训练都给你讲清楚了。原文
00:09AWS Machine Learning Blog@Ashley Chen精选73°本文介绍了使用Amazon Bedrock AgentCore实现生产级多租户系统的池模型模式。通过医疗AI代理示例,展示了为多个诊所和医院构建共享基础设施但隔离租户的架构。该方法可降低运营成本,同时保证每个租户的数据隔离与安全。读者将掌握具体实现步骤与最佳实践。技巧Amazon BedrockAgentCore多租户池模型医疗AI推荐理由:AWS这篇博文手把手教你用Bedrock AgentCore做多租户,共享底层资源又能隔离租户数据,适合医疗等SaaS场景,比自己折腾省心多了。原文
00:08berryxia@berryxia精选Apple开源了一个Linux容器运行时,专为其Apple Silicon芯片优化,使用Swift编写。该工具直接兼容Docker Hub上所有OCI镜像,底层通过轻量级VM实现原生虚拟化,无需模拟或翻译,性能和隔离性显著提升。要求macOS 26系统,以签名pkg包作为系统级服务安装。项目已在GitHub以MIT协议开源并接受社区贡献。AI产品AppleContainerizationmacOS 26容器运行时开源2 个信源在谈推荐理由:Apple下场做了个能跑Docker镜像的容器工具,专为M芯片优化,比Docker Desktop快不少。GitHub开源,可以试试。原文
00:07berryxia@berryxia71°腾讯开源EdgeOne Makers平台,核心是让AI Agent通过一句话自动完成Web应用部署。用户只需告诉Agent“把这个Next.js项目部署了”,系统通过CLI自动执行Git推送、CI/CD触发、边缘函数部署和预览链接生成。平台提供标准化Skill系统,包含边缘函数、云函数、KV存储等模块,支持Node.js、Go、Python三种语言云函数及V8边缘运行时。Claude Code、Cursor、CodeBuddy等AI Agent可直接调用Skill文档操控部署流程。GitHub仓库已开源,集成LangGraph、Claude SDK、OpenAI Agents等主流Agent框架。AI产品EdgeOne Makers腾讯AI Agent云平台开源模型10 个信源在谈推荐理由:腾讯搞了个新玩意EdgeOne Makers,Agent说句话就能自动部署应用,不用再手动点控制台了,开源直接能用。原文
23:33LangChain@LangChainAI欧盟AI法案生效后,合规将成为持续测量义务。LangSmith可将追踪转化为合规证据,其可定制评估器运行在生产流量上,针对偏见、幻觉、毒性、准确性和对抗性输入等EU AI Act要求进行评分。该工具支持实时监控,帮助企业自动生成合规报告。AI产品LangSmithLangChainEU AI ActAI合规模型评估推荐理由:LangChain给LangSmith加了合规评估器,直接在生产数据上检测偏见、幻觉,符合EU AI Act要求,省心。原文
23:32idoubi@idoubiccAITDK 插件由开发者 @blankwebdev 新增付费订阅功能,订阅用户可查看网站 DR、外链、AI 访问量趋势、Adsense 关联网站等。该插件在出海开发者中口碑极佳,日活用户众多。年费会员可使用优惠码 SHIPANY 享八折优惠。AI产品AITDKblankwebdev外链建设SEO工具优惠码推荐理由:站长做外链和竞品调研的利器,AITDK 终于出付费版了,功能实用,优惠码限时八折,别错过。原文
23:30IT之家(博客/媒体)伦敦国王学院和德国新教应用科学大学的研究人员在《自然》发表论文,提出“放大螺旋”框架,解释AI聊天机器人如何助推妄想。聊天机器人的语言对齐、超个性化内容生成和迎合倾向三种特征可能主动强化并扩展用户的错误信念。AI相关妄想与传统技术相关妄想不同,因为聊天机器人能通过无休止的个性化互动主动参与构建妄想观念。研究人员建议医疗人员将聊天机器人使用情况纳入常规筛查,尤其针对出现异常信念的患者。论文聊天机器人放大螺旋AI安全个性化心理健康推荐理由:研究警告说,AI聊天机器人越聊越像你的“复读机”,可能会把你的错误想法越说越真,精神科医生建议多留意。原文
23:27elvis@omarsar0Microsoft Teams 上线了一个 AI 员工功能,它能自动执行工作流程而不仅仅是回答用户问题。该功能目前尚未公布正式名称或版本号,但已在 x.com 上有用户晒出相关截图。这个 AI 员工可以处理任务分配、日程安排等实际工作,标志着 Teams 从协作工具向自动化平台迈出一步。AI产品Microsoft TeamsAI员工智能体推荐理由:Teams 里的 AI 不再只是聊天,它能直接帮你干活,比如自动安排任务。原文
23:26歸藏(guizang.ai)@op7418作者测试了 Seed 2.1 Pro,发现它在智能体和编程任务上的短板已被补上。该模型现在能更流畅地处理复杂代理场景。作者计划将 Seed 2.1 Pro 作为内容创作的主要模型。AI模型Seed 2.1 Pro豆包智能体编程助手内容创作3 个信源在谈推荐理由:豆包刚更新的 Seed 2.1 Pro,智能体和编程短板都补上了,做内容创作更顺手,可以试一下。原文
23:26量子位@十三小鹏汽车、月之暗面Kimi和猎豹移动接入某云计算平台的AI算力,加速Agentic AI部署。该云平台为智能体应用提供弹性计算资源,支持高并发任务。行业普遍认为Agentic AI的商用拐点已经到来。行业小鹏汽车Kimi猎豹移动云计算智能体推荐理由:云计算一哥帮小鹏、Kimi和猎豹跑通Agentic AI,智能体应用加速落地,值得一看。原文
23:10Mistral AI@MistralAI精选73°Mistral AI 今日推出 OCR API 和 Document AI,可在 Mistral AI Studio、Amazon SageMaker、Microsoft Foundry 上直接使用,并即将集成 Snowflake Parse Document。用户也可通过单个容器自托管,确保文档不离开本地环境。该功能旨在提升文档解析和 OCR 处理能力。AI产品Mistral AIOCR APIDocument AI文档处理自托管推荐理由:Mistral AI 刚发了 OCR 和文档 AI,支持多平台部署还能自己托管,处理文档很方便。原文
23:00量子位@十三73°字节跳动发布豆包2.1,其Agent可在18小时内自动完成芯片设计代码编写。在编程基准测试中,豆包2.1的表现比肩Opus 4.7。该版本强化了自主编程和长时任务执行能力,适用于复杂工程场景。AI模型豆包2.1字节跳动智能体芯片设计编程能力推荐理由:豆包2.1的Agent太能干了,独自跑18小时写出芯片代码,编程水平还追上了Opus 4.7,做硬件的可以关注下。原文
22:55berryxia@berryxiaPaul Bakaus宣布成立Renaissance Geek(Impeccable背后公司),获得a16z投资并与GitHub达成合作。他提出“增强工艺”理念,认为AI虽降低了首稿门槛,但真正优秀的工作仍需人类深度参与最后的20%迭代。其首个产品Impeccable为AI coding agent提供设计词汇表,让其在真实代码库中做视觉迭代,而非仅生成聊天slop。Bakaus将目标人群定义为T型通才加高品味、高主动性和强好奇心的人。行业Renaissance GeekPaul BakausImpeccableGitHuba16z增强工艺AI工具推荐理由:Paul Bakaus拿了a16z的钱,说AI让第一稿变容易但天花板没动,他的新公司要做“增强工艺”——让人类参与最后20%迭代,而不是被踢出去。原文
22:54a16z@a16zProbook完成由a16z和Sequoia领投的3400万美元A轮融资。其AI操作系统以调度为核心,整合信息录入、数据清洗和外呼。客户Summers Plumbing首月自动预订2542个工单,Anthony PHCE营收增20%且团队精简50%,Del-Air每个调度员管理的技工从10人增至22人。创始人拥有家庭服务行业背景。行业Probooka16zSequoia家庭服务调度AI推荐理由:Probook拿了3400万美金,专做家庭服务调度AI,客户效果很猛——有的自动接单2500+,有的营收涨两成,团队还砍一半。原文
22:52Hugging Face: Blog(博客/媒体)精选IBM Research推出CUGA,一个轻量级智能体框架,提供24个可直接运行的工作示例。每个示例展示了如何用CUGA构建工具调用、多步推理和状态管理等功能。示例覆盖代码执行、数据库查询、网页浏览等场景,所有代码均在GitHub开源。开发者可通过这些示例快速上手CUGA,无需复杂配置即可构建生产级智能体应用。技巧CUGA智能体IBM Research开源推荐理由:IBM Research开源了CUGA框架,有24个现成示例,教你一步步构建能调用工具、多步推理的智能体。想快速上手Agent开发可以看看。原文
22:26Viking@vikingmute作者建议定期清理AI skills,认为过时或无用的skills会产生副作用。目前只保留mattpocock的几个开发流程相关skills,以及自己项目相关的review和测试skills。之前各种生图、PPT、设计相关的skills已全部删除。技巧skills技能清理mattpocock工作流优化AI配置推荐理由:朋友,定期清理用不上的skills能让AI表现更好,建议你也试试删掉过时的,只留真正需要的开发流程skills。原文
22:23elvis@omarsar0QodoAI 发布了 Cross Repo Review 功能,用于检测跨仓库代码变更引发的连锁 bug。该功能不局限于单次提交的变更,而是追踪三个仓库之外的潜在影响。作者在个人 repo 上测试,成功捕获了传统工具遗漏的跨仓库依赖问题。这一更新解决了多仓库协作中的常见痛点。AI产品QodoAICross Repo Review代码审查编程助手推荐理由:QodoAI 的新功能能帮你发现跨仓库的隐式 bug,比只看单次变更的工具有用得多。原文
22:12IT之家(博客/媒体)进迭时空完成新一代自研互联总线 N200 的研发,这是继通算CPU核X100/X200、智算AI核A60/A100/A200后的核心版图升级。N200支持AXI2CHI、CHI2AXI等协议转换,可接入PCIe、GPU等外设,并支持RISC-V RERI规范的端到端RAS实现。该总线将与通算CPU核X200、智算AI核A200共同应用于下一代计算芯片,预计2027年量产。N200还提供时钟结构、Debug & Trace、PMU统计、Partial Good设计及配置GUI等完整配套能力。行业进迭时空N200X200A200RISC-V推荐理由:进迭时空搞定了新一代互联总线N200,能接各种外设,还有RISC-V RAS支持,和X200、A200核凑齐了下一代芯片的三大件,2027年量产,值得看。原文
22:09LangChain@LangChainAI精选76°LangChain与Fireworks AI合作,微调阿里Qwen模型构建了trace judge,用于检测生产trace中的“感知错误”。该judge在性能上匹敌或超越前沿模型,同时运行成本降低100倍。相关研究成果已发表在LangChain Labs博客。AI产品LangChainFireworks AIQwen微调AI评估推荐理由:LangChain搞了个低成本trace judge,用阿里Qwen微调,性能不输顶级模型还便宜100倍,做trace监控的可以看看。原文
21:28techcrunch@Lauren ForristalFika Jobs 完成 400 万美元种子轮融资,打造视频优先的招聘平台。该平台利用 AI 代理自动面试候选人,取代传统简历筛选。旨在解决招聘流程中的低效和黑箱问题,应对生成式 AI 带来的申请量激增。行业Fika JobsAI面试AI代理招聘平台推荐理由:Fika Jobs 融了 400 万美元,用 AI 代理直接视频面试候选人,替代传统的简历筛选,对求职者和HR都挺实用。原文
21:24Justin Welsh@thejustinwelsh一条获得34条评论、4641次查看的帖子分享了用AI进行产品构思和迭代的步骤:先和AI头脑风暴,找到用户想要的产品,然后在线讨论、收集反馈,接着构建并发布,再与用户交流,重复这一循环。这个方法强调快速验证和持续迭代,没有依赖任何特定模型或工具。技巧产品迭代用户反馈MVPAI辅助推荐理由:这个帖子里分享了一个用AI快速验证产品想法的方法,从头脑风暴到发布再收集反馈,循环迭代,很实用。原文
21:00IT之家(博客/媒体)精选戴尔在 ISC 大会上发布 PowerEdge XE8812 服务器,采用 NVIDIA Vera Rubin NVL4 架构,每机架最多支持 144 块 GPU,全液冷设计。与上一代相比,每个插槽内存和 GPU 显存提升 50%,CPU 核心从 144 增至 176。该服务器支持超 300kW 供电,从部署到运行需 6 小时。劳伦斯伯克利国家实验室、InstaDeep 等已计划部署。AI产品PowerEdge XE8812NVIDIA Vera Rubin NVL4Dell液冷服务器AI服务器4 个信源在谈推荐理由:戴尔出了个超强 AI 服务器,每机架 144 块 GPU,全液冷,比上一代内存显存都涨 50%,适合跑超大模型。原文
20:54Geek@geekbb一位X平台用户发布视频探讨AI与中医结合的可能性。该帖子已获得1188次浏览、8条评论和2个点赞。视频内容可能涉及AI辅助中医诊断或数据分析的应用场景,引发对传统医学现代化路径的讨论。行业中医医疗AI智能诊疗推荐理由:有人发了视频聊AI能不能给中医搭把手,挺新鲜的角度,可以去看看评论区吵成啥样了。原文
20:34Decoder@Maximilian SchreinerCursor宣布推出首款完全自研的AI模型。同时发布了新的Git平台和移动应用。AI模型专为代码生成优化,Git平台提供版本控制协作功能,移动应用支持手机端编程。AI产品Cursor自研AI模型Git平台移动应用编程助手9 个信源在谈推荐理由:Cursor自家出了AI模型和Git平台,还有手机App,做代码开发的可以试试。原文
20:33Decoder@Maximilian Schreiner74°字节跳动在火山引擎FORCE大会上发布了五款新AI模型,其中Seedance 2.5视频模型计划于7月初上线。Seedance 2.5将AI视频生成时长从行业常见的十几秒提升至30秒,支持更高分辨率和一致性。该模型基于扩散架构,有望在短视频创作和广告领域应用。AI模型SeedanceByteDance视频生成30秒2 个信源在谈推荐理由:字节跳动新发布的Seedance 2.5视频模型能直接生成30秒视频,比之前模型长一倍,做短视频创作者可以试试。原文
20:25berryxia@berryxiaSeedance 的视频生成模型在发布后展现出显著的领先优势,短期内其他模型难以追赶。该模型在视频生成质量、连贯性和一致性等方面表现突出,但具体基准数据未披露。AI模型Seedance视频生成推荐理由:Seedance 刚出的视频生成模型,效果确实碾压同行,还没看到能打的。原文