13:19歸藏(guizang.ai)@op7418精选71°Twitter(X)现已推出 MCP 接口,允许 AI 工具直接访问实时信息。配置需在 Twitter 开发者后台创建 APP 并充值,调用费用为 0.01 美元/次(1 美元 1000 次)。作者拉取近三天书签仅花费 0.1 美元。配置步骤包括创建 APP、获取配置 ID、在 MCP 配置文件中替换 ID,以及授权启动。配置过程可借助 Codex 或 Claude 辅助。技巧TwitterMCPX API配置教程智能体推荐理由:想用 AI 分析你自己的 Twitter 数据吗?MCP 接口花几分钱就能让 AI 帮你整理书签和信息流,跟着这个教程一步步配置就行。原文
13:17Geek@geekbb精选Qwythos 9B 基于 Qwen3.5-9B,在 5 亿 token 的 Claude 思维链轨迹上全参数微调,可处理 1M 上下文。支持原生 Function Calling 和多模态视觉(图像+文本)。GGUF 量化后仅 5.2 GiB,可在低配设备上运行。该模型为开源且未经审查。AI模型Qwythos 9BQwen3.5-9BClaude推理模型多模态推荐理由:Empero AI 开源的 Qwythos 9B 把 Qwen3.5 和 Claude 思维链结合,1M 上下文加 Function Calling,量化后 5.2GB 的推理模型,低配机器也能跑。原文
13:02宝玉@dotey精选该项目用约4300行代码(TypeScript和Python两个版本)复现了Claude Code的核心架构。涵盖Agent Loop、13个工具(含并行执行+流式早期启动)、4层上下文压缩、语义记忆召回、技能系统、多Agent、MCP集成等模块。全书共13章,每章均为分步教程,对照真实源码讲解简化实现思路。技巧Claude Code开源教程AgentMCPTypeScript推荐理由:想搞懂Claude Code怎么工作的?这个教程用4300行代码讲清楚了,还有TypeScript和Python两个版本可以跟着写。原文
12:52Guillermo Rauch@rauchg精选Next.js 16.3 预览版主要优化了 Turbopack 的文件系统缓存,构建速度提升 5.5 倍。开发模式内存使用减少 90%,HMR 和启动速度也显著提升。此版本还包含了实验性的 Rust React 编译器。AI产品Next.jsTurbopackRust编译器ReactVercel推荐理由:Next.js 16.3 用文件系统缓存让构建快 5.5 倍,内存省 90%,Vercel 这波性能优化太狠了。原文
12:39歸藏(guizang.ai)@op7418精选OpenAI与Work Louder合作,基于Creator Micro 2型号推出Codex定制Vibecoding键盘。键盘配备13个机械按键、一个旋钮、一个摇杆和触摸传感器,支持RGB背光及底部灯光。摇杆可弹出屏幕上的圆形快捷菜单,支持6层映射,每层含13个按键、7个径向菜单槽位及旋钮映射。原版Creator Micro 2售价144美元起,定制版价格未公布。AI产品OpenAICodexWork Louder编程键盘Creator Micro 25 个信源在谈推荐理由:OpenAI和Work Louder联名出键盘了,专为Codex编程场景设计,摇杆快捷菜单加多层映射,想提升编码效率可以关注一下。原文
12:39arXiv: DeepSeek@Lei Bai, Zongsheng Cao, Yang Chen, Zhiyao Cui, Shangheng Du, Yue Fan, Shiyang Feng, Zijie Guo, Haonan He, Liang He, Xiaohan He, Shuyue Hu, Yusong Hu, Songtao Huang, Yichen Jiang, Hao Li, Xin Li, Dahua Lin, Weihao Lin, Fenghua Ling, Dongrui Liu, Zhuo Liu, Runmin Ma, Chunjiang Mu, Haoyang Peng, Tianshuo Peng, Jinxin Shi, Luohe Shi, Boyuan Sun, Zelin Tan, Shengji Tang, Qianyi Wang, Yiming Wu, Yi Xie, Xiangchao Yan, Jingqi Ye, Peng Ye, Fangchen Yu, Jiakang Yuan, Bihao Zhan, Bo Zhang, Chen Zhang, Shufei Zhang, Shuaiyu Zhang, Wenlong Zhang, Yiqun Zhang, Junpeng Zhao, Zhijie Zhong, Bowen Zhou, Yuhao Zhou精选Agents-A1是一个35B参数的Mixture-of-Experts智能体模型,通过扩展智能体视野(平均轨迹长度45K tokens)达到万亿参数级别性能。它在SEAL-0(56.4)、IFBench(80.6)、HiPhO(46.4)、FrontierScience-Olympiad(79.0)和MolBench-Bind(56.8)上超越了1T参数的Kimi-K2.6和DeepSeek-V4-pro,在SciCode(44.3)、HLE(47.6)和BrowseComp(75.5)上也具有竞争力。训练采用三阶段流程:全领域SFT、领域级教师模型、多教师领域路由在线蒸馏。AI模型Agents-A135B智能体推理模型MoE推荐理由:35B的模型干翻万亿参数?Agents-A1用长视野扩展和智能体框架做到,基准全面领先,值得看看怎么训练的。原文
12:35小互@imxiaohu精选Meta发布Brain2Qwerty v2脑机接口系统,无需植入仅需佩戴MEG头盔即可实时解码大脑磁信号为文字。该系统在字词准确率上达到61%,约为其他无创方法(8%)的7.6倍。最佳参与者准确率达78%,超过半数句子仅有一个词错误。这是目前性能最高的非侵入式脑机接口系统。AI模型MetaBrain2Qwerty v2MEG无创脑机接口神经解码推荐理由:Meta这个新脑机接口太强了,戴个头盔就能把你脑子里想的话实时转成文字,准确率61%,比之前的方法好7倍多,连手术都不用。原文
12:33LangChain@LangChainAI精选大多数智能体在对话结束后评分,通过/失败或解决/放弃。GetCandidly 开发了一个新模型,能在对话进行中实时读取并引导走向解决。该模型改变了智能体的评估方式,旨在提升对话解决效率。目前通过 LangChain 博客公开。AI产品GetCandidlyLangChain实时引导智能体对话系统推荐理由:别等智能体最后打分才调整,GetCandidly 搞了个实时引导模型,边聊边纠正,挺实用。原文
12:17Geek@geekbb精选X开发者(@XDevelopers)宣布推出托管X MCP,提供两个服务器:一个通过本地桥接调用真实X API操作账号,另一个直接查阅X开发文档,二者可同时使用。该MCP支持Grok、Cursor等AI工具无缝连接X API,无需额外设置。AI产品XMCPAPI智能体工具8 个信源在谈推荐理由:X官方出了MCP服务器,一个能直接操作你的X账号,一个查文档,还能一起用,支持Grok、Cursor等。原文
12:16AI Will@FinanceYF5精选73°Claude 正式进驻 Microsoft Foundry,即日起全面开放。Azure 账号可直接调用 Claude Opus 4.8 和 Haiku 4.5,身份验证、计费、合规管控沿用 Azure 现有体系。支持 prompt caching 和扩展思考功能,并覆盖有美国数据驻留需求的团队。这降低了企业使用 Claude 的门槛。AI产品ClaudeMicrosoft FoundryAzureClaude Opus 4.8模型部署推荐理由:Azure 用户现在可以直接用 Claude Opus 4.8 和 Haiku 4.5,不用改现有身份和计费系统,企业部署更快了。原文
11:49marktechpost@Michal Sutter精选本文介绍了6款无代码工具,支持构建企业级RAG系统、多智能体工作流以及微调数百个LLM。这些工具无需编程经验即可快速部署智能应用,显著缩短开发周期。文章逐一解析每款工具的核心功能和适用场景。技巧无代码工具RAG多智能体LLM微调AI开发推荐理由:想不写代码就搞定AI应用?这6个工具能帮你快速搭RAG、调模型,省时又省力。原文
11:47arXiv cs.LG@Şuayp Talha Kocabay, Talha Rüzgar Akkuş, Kerem Yalçın精选论文证明组合函数树的Rademacher复杂度不随符号结构数量指数增长,而是受深度d和基算子Lipschitz常数控制。具体界为ℜ_n(ℋ_comp^d) ≤ (Kb√2L)^{d-1}ℜ_n(ℋ_comp^1),其中K为算子库大小、b为元数。当K,b=O(1)时,高概率风险界为O(L^d/√n)。实验在合成物理类目标上验证了理论预测。论文PAC学习符号回归Rademacher复杂度组合函数树推荐理由:论文把PAC学习理论用到符号回归上,证明了组合函数树的样本复杂度不会随深度爆炸,还给了可跑的代码。原文
10:43Ate-a-Pi@svpino精选建议用“value per token dollar”指标评估智能体:将智能体产生的价值除以消耗的token成本。比值低于1表示成本大于回报;等于1表示收支平衡;高于1则可用该智能体构建业务。不同智能体即使使用相同模型和token数,创造的价值也可能完全不同。@matrix_build 团队首次采用这一指标。技巧value per token dollarmatrix_build智能体成本效益评估方法推荐理由:别再纠结智能体能不能干了,试试用“值多少token”来算账,看投入产出比高不高。原文
10:38arXiv: Google DeepMind@Qijun Li, Zheng Fu, Qi Song, Yifei He, Weitao Zhou, Kun Jiang, Diange Yang精选Dual-Flow RL利用条件流匹配(CFM)同时建模回报分布和多模态策略分布,克服了传统单峰高斯价值估计的偏差问题。该方法引入熵-协方差探索调节器(ECER),实现基于状态的自适应探索。在DeepMind Control Suite的36个任务中,Dual-Flow RL在32个任务上取得最优,并在Humanoid-Bench上显著优于diffusion-based和flow-based方法。ECER通过策略熵与动作不确定性协方差动态调节探索强度,避免了模式坍塌。论文Dual-Flow RLDeepMind Control SuiteHumanoid-Bench强化学习多模态探索推荐理由:这篇论文用条件流匹配把回报分布和多模态策略一起建模,解决了强化学习中的多模态探索难题,在DeepMind控制任务上吊打了扩散方法。原文
10:36arXiv: DeepSeek@Hui Zang, Pengfei Xia, Hong Liu, Jiajia Chu, Tuo Hao, Minghao Chen, Rui Zhang, Ziyang Zhang精选Mixture-of-Experts (MoE)架构通过稀疏激活扩展模型规模,但数据移动瓶颈导致推理效率低下。两个关键问题:低贡献专家带来几乎均等的内存与传输成本(成本收益比低),以及多设备部署中受最慢设备限制。CAEE框架利用轻量级成本模型估算硬件开销,选择性剪枝低重要性高成本专家,并通过低开销补偿机制避免额外数据传输。在DeepSeek-R1(671B参数)上的评估显示,CAEE将端到端推理延迟降低8%-18%(专家卸载与设备内执行),模型准确率下降小于1%。论文CAEEMoEDeepSeek-R1推理优化多设备推荐理由:CAEE框架能降低MoE模型推理延迟8%-18%,且准确率几乎不受影响。DeepSeek-R1用户可重点关注。原文
10:28pandaily@contact@pandaily.com (Pandaily)精选由于EUV光刻工具受限,中国AI芯片设计者正押注3D混合键合与堆叠技术。该技术通过垂直堆叠芯片来提升性能,绕过传统制程缩放瓶颈。此举旨在缩小与西方先进芯片的性能差距。行业3D堆叠混合键合EUV光刻AI芯片先进封装推荐理由:中国芯片厂用3D堆叠绕过EUV限制,这个弯道超车的技术路线值得一看。原文
10:13arXiv cs.AI@Haoliang Han精选论文在Nengo LIF/PES尖峰网络上展示了agency-gated slow credit机制。实验显示,移除缓冲区后自我保存行为保留分数0.96(N=50),慢解码器重置或去门后行为崩溃。在24维部分观测控制中,自我信用产生持久行为(0.74 vs 0.00)。多任务学习中,乘法否决防止遗忘,最终准确率0.88,遗忘0.13,而基线方案性能接近随机。论文将持久残留形式化为操作性的行为自我。论文Spiking AgentSelf-Caused Credit智能体尖峰神经网络推荐理由:这篇论文用实验硬数据展示了尖峰智能体如何通过自我因果信用形成持久行为,对比了多种条件,对构建有自我认知的AI很有启发。原文
09:19掘金本周最热@猫猫头啊精选文章对比了Step 3.7 Flash、DeepSeek V4 Flash、Gemini 3.5 Flash在Agent场景下的代码生成效率、响应速度和工具调用稳定性。测试采用Claude Code工具,第一个案例从零搭建开发者日志站,Step 3.7 Flash一次生成,输出25.7k tokens,成本¥1.22,耗时2m30s;DeepSeek V4 Flash成本¥0.72,输出14k tokens。第二个案例搭建GitHub项目雷达,Step 3.7 Flash无错误完成,Gemini 3.5 Flash有2次自动修复报错。在视觉效果和稳定性上Step 3.7 Flash表现更优,但DeepSeek V4 Flash成本更低。AI模型Step 3.7 FlashDeepSeek V4 FlashGemini 3.5 Flash智能体代码生成2 个信源在谈推荐理由:最近这几个Flash模型我帮你试了,Step 3.7 Flash写博客页和抓GitHub项目都很稳,页面好看,一次跑通,成本也就一两块钱,值得试试。原文
08:30coderabbitai@coderabbitai精选两年前业界普遍认为AI将加速代码审查,实现同等工作更短时间。实际数据反驳了这一假设:AI审查发现的问题数量增加约1.7倍,逻辑错误增加75%,安全漏洞增加约2倍。代码审查的瓶颈从编写转移到了审查环节。行业代码审查AI效率安全漏洞逻辑错误推荐理由:别以为AI真能帮你省时间——数据说反而多了1.7倍的问题和两倍的漏洞,搞代码的要警惕这个新瓶颈。原文
07:51marktechpost@Asif Razzaq精选OpenClaw 推出了 iOS 和 Android 配套节点应用,通过 WebSocket 将手机连接到自托管的 Gateway。这些应用不是独立聊天机器人,而是为本地优先的 AI 代理添加设备硬件,包括相机、位置、语音和 Canvas。文章为构建者详解了架构、能力和权衡。AI产品OpenClawiOSAndroidGatewayAI代理1 个信源在谈推荐理由:OpenClaw 出了 iOS 和 Android 的配套 App,连到你自家搭的 AI 网关,手机摄像头、位置、语音都能当智能体的感知器。想自己搞本地 AI 代理可以试试。原文
07:38Claude Code: GitHub Releases@ashwin-ant精选Anthropic 发布 Claude Code v2.1.196,新增组织默认模型支持(管理员可在 org console 设置),会话开始时显示可读默认名称,并支持 Cmd/Ctrl-click 在 Finder/Explorer 中打开文件附件。安全性方面,claude mcp list / get 不再从已提交的 .claude/settings.json 中启动 .mcp.json 服务器。修复了后台作业唤醒时永久删除对话、速率限制警告闪烁、PowerShell git diff / git grep 退出码为 1 时报错、多个 claude agents 侧面板问题(键盘焦点卡死、子代理类型丢失、状态显示错误)等 20 余项 bug。AI产品Claude CodeAnthropic版本更新编程助手MCP/工具7 个信源在谈推荐理由:Claude Code 又修了一堆 bug,还加了组织默认模型和点开文件附件,用它的开发者赶紧更新吧。原文
03:09marktechpost@Asif Razzaq精选NVIDIA 开源了 BioNeMo Agent Toolkit,将 OpenFold3、DiffDock 和 GenMol 等生物分子模型包装为 AI 代理可直接调用的技能。每个技能包含模型用途、输入、输出和失败模式说明。在 NVIDIA 使用 Codex CLI 和 GPT-5.5 fast 的基准测试中,该工具将任务完成率从 57.1% 提升至 100%,并实现 token 效率翻倍。AI产品NVIDIABioNeMo Agent ToolkitOpenFold3DiffDock药物发现4 个信源在谈推荐理由:NVIDIA 开源了这个工具,让 AI 代理能直接调用分子模型做药物发现。用上它任务完成率翻倍还省 Token,做生物计算的同学可以试试。原文
03:05@koltregaskes@koltregaskes精选前沿模型成本上升、令牌使用量攀升以及近期禁令,使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型,使用LoRA在自有数据上微调,部署在自有基础设施,可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛,关键在于管理层是否将其视为基础设施投资而非普通软件开支。行业LlamaQwenLoRAHugging Face微调推荐理由:前沿模型越来越贵还被禁,自己微调Llama或Qwen更可控,一次性投入省月费,数据也安全。原文
02:49Hugging Face: Blog(博客/媒体)精选Allen AI 发布 DiScoFormer,一种基于 Transformer 的架构,同时学习任意数据分布的密度函数和得分函数。传统方法如 NICE、MAF、ResFlow 需分别建模或使用归一化流,DiScoFormer 通过单一模型完成且无需显式归一化。在 2D 环形、高维高斯混合等多个基准分布上,DiScoFormer 的密度估计和得分误差均低于这些基线。该论文已被 NeurIPS 2024 接收,代码和预训练模型已在 GitHub 开源。AI模型DiScoFormerAllen AITransformer密度估计生成模型推荐理由:Allen AI 搞了个新模型 DiScoFormer,一个 Transformer 既能算密度又能算得分,比 NICE 这些老方法误差更低。想省事搞密度估计的可以看看。原文
02:47AWS Machine Learning Blog@Enrique Salgado Hernández精选本文介绍了Amazon QuickSight中BI资产的备份最佳实践。首先讲解如何选择需要备份的资产(如仪表板、数据集等)。然后说明可用的API(如ListDashboards、CreateDashboard)用于备份操作。最后提供示例代码帮助快速实现备份流程。技巧Amazon QuickSightAWS备份策略BI资产教程推荐理由:AWS教你备份QuickSight资产,有代码示例,照着做就能避免数据丢失。原文
01:58AWS Machine Learning Blog@Anuranjan Mondal精选PAR 在 AWS 上构建了一个生产级多租户 LLM 分析系统,通过三层架构强制执行行级安全:使用 AWS SigV4 进行加密请求签名、在 Amazon Bedrock 上进行语义验证、以及通过 Split-Plane SQL 实现程序化数据隔离。每层独立运行以降低跨租户数据暴露风险,即使 LLM 本身被攻破或操纵也能保护数据。技巧AWSAmazon Bedrock多租户行级安全AI安全推荐理由:AWS 这篇教程手把手教你用 Bedrock 和 Split-Plane SQL 搭建多租户 LLM 分析系统,三层隔离防止数据泄露,值得做企业级 AI 安全的开发者看看。原文
01:57AWS Machine Learning Blog@Sanghwa Na精选AWS 博客展示如何用 Amazon Nova 2 Lite 和 Claude Sonnet 4.6 构建两模型管道,用于扫描文档的数字化。Nova 2 Lite 在单次调用中完成多模态提取(检测照片、提取姓名坐标、返回页面元数据)。Claude Sonnet 4.6 根据版面布局进行空间推理,将姓名和面孔匹配。该管道在 Amazon Bedrock 上运行,通过分工降低总处理成本。技巧Amazon Nova 2 LiteClaude Sonnet 4.6Amazon Bedrock文档数字化多模态1 个信源在谈推荐理由:用 Nova 2 Lite 做粗提取,Claude Sonnet 4.6 做精准匹配,文档数字化省心又省钱。原文
01:56AWS Machine Learning Blog@Troy Parrett精选本教程展示如何结合Amazon Bedrock Data Automation自动提取医疗理赔表单数据,再通过Amazon Bedrock AgentCore托管AI代理进行验证并转换为FHIR资源存入AWS HealthLake。该端到端工作流可减少人工处理流程,同时通过自动化校验保持数据准确性。文中逐步讲解每个组件的配置与集成方法。技巧Amazon BedrockAWS HealthLakeFHIR智能体医疗数据推荐理由:AWS官方手把手教你搭医疗理赔流水线,用Bedrock自动抽数据、转FHIR格式存HealthLake,能省不少人工核对时间。原文
01:33AWS Machine Learning Blog@Joshua Lacy精选本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式,如无限循环和工具调用失败。通过追踪和指标分析智能体行为,并提供结构化工作流来解决问题。本文是两部分系列的第一部分,第二部分将讨论性能优化和内存管理。技巧Amazon BedrockAgentCore可观测性智能体工具调用推荐理由:AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障,比如无限循环和工具调用失败,省去自己搭建监控的麻烦。原文
01:17Simon Willison’s Weblog(博客/媒体)精选DeepReinforce 发布 Ornith-1.0,一款 MIT 许可的开源模型,基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本,能流畅运行代理工具调用并处理代码定位任务。AI模型Ornith-1.0DeepReinforceGemma 4Qwen 3.5开源模型1 个信源在谈推荐理由:DeepReinforce 新出的开源编码模型,基于 Gemma 4 和 Qwen 3.5,在代理编码任务上表现不错,LM Studio 就能跑,值得试试。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……