03:09marktechpost@Asif Razzaq精选NVIDIA 开源了 BioNeMo Agent Toolkit,将 OpenFold3、DiffDock 和 GenMol 等生物分子模型包装为 AI 代理可直接调用的技能。每个技能包含模型用途、输入、输出和失败模式说明。在 NVIDIA 使用 Codex CLI 和 GPT-5.5 fast 的基准测试中,该工具将任务完成率从 57.1% 提升至 100%,并实现 token 效率翻倍。AI产品NVIDIABioNeMo Agent ToolkitOpenFold3DiffDock药物发现3 个信源在谈推荐理由:NVIDIA 开源了这个工具,让 AI 代理能直接调用分子模型做药物发现。用上它任务完成率翻倍还省 Token,做生物计算的同学可以试试。原文
03:08@koltregaskes@koltregaskes78°GPT-5.6 Sol Preview 出现在 Cursor 的内部测试中,据称支持 100 万 token 上下文窗口。该发现来自 X 用户 koltregaskes 的截图,暗示 OpenAI 正在推进超长上下文能力。若属实,这将远超 GPT-4 的 128K 上下文上限。目前 OpenAI 尚未官方确认此模型的存在。AI模型GPT-5.6 Sol PreviewCursor上下文窗口1M上下文8 个信源在谈推荐理由:OpenAI 的 GPT-5.6 Sol Preview 悄悄在 Cursor 里测试,上下文直接拉到 1M,能一口气吞整本小说了。原文
03:07@koltregaskes@koltregaskesEthan Mollick根据Artificial Analysis的AA-Briefcase分数,绘制了AI模型在复杂多周咨询任务上的表现趋势。AA-Briefcase测试模型处理电子表格和策略规划等可交付成果。GLM-5.2等开源模型目前达到的水平,与闭源模型三个月前的分数一致。高端闭源模型仍保持明显领先,但差距在缩小。AI模型GLM-5.2AA-Briefcase开源模型智能体基准测试推荐理由:开源模型GLM-5.2在AA-Briefcase智能体基准上只差闭源三个月了,做复杂任务时值得试试看。原文
03:06@koltregaskes@koltregaskes79°DeepSeek v4 将于 7 月中旬进入通用可用(GA)阶段,部分用户已收到相关邮件通知。该版本带来更多功能优化和性能改进。具体改进细节尚未完全公开,但用户可期待更优的模型能力。AI模型DeepSeek v4DeepSeek开源模型推理模型推荐理由:DeepSeek v4 马上 GA 了,7 月中旬上线,性能有优化,想尝鲜的可以关注。原文
03:05@koltregaskes@koltregaskes精选前沿模型成本上升、令牌使用量攀升以及近期禁令,使企业自建AI变得更加必要。通过下载Llama或Qwen等开源模型,使用LoRA在自有数据上微调,部署在自有基础设施,可一次性计算成本取代按席收费。Hugging Face和LoRA已降低技术门槛,关键在于管理层是否将其视为基础设施投资而非普通软件开支。行业LlamaQwenLoRAHugging Face微调推荐理由:前沿模型越来越贵还被禁,自己微调Llama或Qwen更可控,一次性投入省月费,数据也安全。原文
02:49Hugging Face: Blog(博客/媒体)精选Allen AI 发布 DiScoFormer,一种基于 Transformer 的架构,同时学习任意数据分布的密度函数和得分函数。传统方法如 NICE、MAF、ResFlow 需分别建模或使用归一化流,DiScoFormer 通过单一模型完成且无需显式归一化。在 2D 环形、高维高斯混合等多个基准分布上,DiScoFormer 的密度估计和得分误差均低于这些基线。该论文已被 NeurIPS 2024 接收,代码和预训练模型已在 GitHub 开源。AI模型DiScoFormerAllen AITransformer密度估计生成模型推荐理由:Allen AI 搞了个新模型 DiScoFormer,一个 Transformer 既能算密度又能算得分,比 NICE 这些老方法误差更低。想省事搞密度估计的可以看看。原文
02:47AWS Machine Learning Blog@Enrique Salgado Hernández精选本文介绍了Amazon QuickSight中BI资产的备份最佳实践。首先讲解如何选择需要备份的资产(如仪表板、数据集等)。然后说明可用的API(如ListDashboards、CreateDashboard)用于备份操作。最后提供示例代码帮助快速实现备份流程。技巧Amazon QuickSightAWS备份策略BI资产教程推荐理由:AWS教你备份QuickSight资产,有代码示例,照着做就能避免数据丢失。原文
02:20Decoder@Matthias BastianAmazon工程师正在蒸馏Anthropic模型为更小、更便宜的版本供内部使用。从2025年起,Amazon将按处理的token数而非计算小时数向Anthropic付费,这可能大幅推高成本。为应对涨价,Amazon也在评估OpenAI等其他模型供应商。行业AmazonAnthropicOpenAI模型蒸馏token定价10 个信源在谈推荐理由:亚马逊工程师把Anthropic模型蒸馏成小版本来省钱,因为明年起要按token付费了,这招挺实用。原文
02:19Decoder@Matthias Bastian奥地利数字部长Alexander Pröll呼吁欧盟委员会考虑将美国AI公司Anthropic引入欧洲,以应对美国对OpenAI和Anthropic高级模型的出口限制。他认为此举有助于欧盟摆脱对美国AI的依赖。但文章指出该提议不现实,因为Anthropic在美国已有强大技术生态和监管约束。同时,转向中国AI模型只会导致另一种依赖,无法实现真正的AI独立性。行业AnthropicOpenAI欧盟AI监管奥地利10 个信源在谈推荐理由:欧盟想摆脱对美国AI的依赖,奥地利提议把Anthropic拉过来,但这事儿不太靠谱。看看他们怎么想的。原文
02:18techcrunch@Amanda SilberlingAnthropic与加州州长纽森达成一项协议,允许加州政府以标准定价50%的折扣使用其AI助手Claude。此举使Anthropic与州政府建立了更紧密的合作关系,而联邦政府则对OpenAI等其他AI公司采取了更严厉的态度。该协议可能推动AI技术在美国州级政府的进一步采用。行业AnthropicClaude加州AI合作10 个信源在谈推荐理由:Anthropic让加州政府半价用Claude,比OpenAI更得官方青睐,搞政府生意的路子值得看看。原文
02:17techcrunch@Kate Park三星和SK海力士等南韩内存芯片巨头宣布联合投资超过5500亿美元建设新的内存晶圆厂,以应对AI需求激增导致的RAMageddon(内存短缺危机)。这些投资计划在未来10年内完成,旨在将南韩打造为全球AI技术枢纽。此举有望大幅提升HBM和DDR5等高端内存产能,缓解供应紧张局面。行业南韩内存芯片AI基础设施RAMageddon推荐理由:南韩两大芯片厂砸5500亿美元扩产内存,AI一火,内存就不够用了,看他们怎么救场。原文
01:58AWS Machine Learning Blog@Anuranjan Mondal精选PAR 在 AWS 上构建了一个生产级多租户 LLM 分析系统,通过三层架构强制执行行级安全:使用 AWS SigV4 进行加密请求签名、在 Amazon Bedrock 上进行语义验证、以及通过 Split-Plane SQL 实现程序化数据隔离。每层独立运行以降低跨租户数据暴露风险,即使 LLM 本身被攻破或操纵也能保护数据。技巧AWSAmazon Bedrock多租户行级安全AI安全推荐理由:AWS 这篇教程手把手教你用 Bedrock 和 Split-Plane SQL 搭建多租户 LLM 分析系统,三层隔离防止数据泄露,值得做企业级 AI 安全的开发者看看。原文
01:57AWS Machine Learning Blog@Sanghwa Na精选AWS 博客展示如何用 Amazon Nova 2 Lite 和 Claude Sonnet 4.6 构建两模型管道,用于扫描文档的数字化。Nova 2 Lite 在单次调用中完成多模态提取(检测照片、提取姓名坐标、返回页面元数据)。Claude Sonnet 4.6 根据版面布局进行空间推理,将姓名和面孔匹配。该管道在 Amazon Bedrock 上运行,通过分工降低总处理成本。技巧Amazon Nova 2 LiteClaude Sonnet 4.6Amazon Bedrock文档数字化多模态推荐理由:用 Nova 2 Lite 做粗提取,Claude Sonnet 4.6 做精准匹配,文档数字化省心又省钱。原文
01:56AWS Machine Learning Blog@Troy Parrett精选本教程展示如何结合Amazon Bedrock Data Automation自动提取医疗理赔表单数据,再通过Amazon Bedrock AgentCore托管AI代理进行验证并转换为FHIR资源存入AWS HealthLake。该端到端工作流可减少人工处理流程,同时通过自动化校验保持数据准确性。文中逐步讲解每个组件的配置与集成方法。技巧Amazon BedrockAWS HealthLakeFHIR智能体医疗数据推荐理由:AWS官方手把手教你搭医疗理赔流水线,用Bedrock自动抽数据、转FHIR格式存HealthLake,能省不少人工核对时间。原文
01:33AWS Machine Learning Blog@Joshua Lacy精选本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式,如无限循环和工具调用失败。通过追踪和指标分析智能体行为,并提供结构化工作流来解决问题。本文是两部分系列的第一部分,第二部分将讨论性能优化和内存管理。技巧Amazon BedrockAgentCore可观测性智能体工具调用推荐理由:AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障,比如无限循环和工具调用失败,省去自己搭建监控的麻烦。原文
01:17Simon Willison’s Weblog(博客/媒体)精选DeepReinforce 发布 Ornith-1.0,一款 MIT 许可的开源模型,基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本,能流畅运行代理工具调用并处理代码定位任务。AI模型Ornith-1.0DeepReinforceGemma 4Qwen 3.5开源模型1 个信源在谈推荐理由:DeepReinforce 新出的开源编码模型,基于 Gemma 4 和 Qwen 3.5,在代理编码任务上表现不错,LM Studio 就能跑,值得试试。原文
01:08techcrunch@Russell BrandomCursor发布了其首个移动应用,允许开发者远程监督和指导正在运行的编程智能体(coding agent)。该应用支持进度查看、命令发送和代码变更确认,桌面端已有超过100万用户。目前仅iOS版本开放测试,安卓版本即将推出。AI产品Cursor编程助手移动应用2 个信源在谈推荐理由:Cursor出了手机版,能遥控电脑上的编程智能体,出远门也能改代码了。原文
01:01Vercel AI@vercelVercel 宣布其 AI Gateway 新增实时语音和转录能力,开发者可使用 useRealtime、generateSpeech 和 transcribe 三个工具。该功能基于 AI SDK 7 构建,支持实时语音交互、语音合成和语音识别。无需从零搭建基础设施,即可快速为应用加入语音代理功能。AI产品VercelAI Gatewayvoice agents语音识别实时交互推荐理由:Vercel 把语音代理直接做到 AI Gateway 里了,用 useRealtime 就能接入实时对话,省掉搭服务器。原文
00:38量子位@思邈一家具身智能公司发布全球首个隐空间世界模型,实现长时序双向物理因果链建模。该公司刚完成2亿美元融资,并凭借该模型在具身智能榜单上排名第一。该模型可处理复杂时序物理交互,提升机器人长期规划能力。行业隐空间世界模型具身智能融资推荐理由:这家公司刚拿了2亿美元,用隐空间世界模型直接干到具身榜单第一,值得看他们怎么做到的。原文
00:17Hunyuan@TXhunyuan12款中国AI模型对世界杯32强比赛结果进行了预测。首轮榜单显示,腾讯混元(Tencent Hy)成功预测29场,以29/32的准确率排名第一。其他11款模型的具体准确率未在文中列出。现在比赛进入淘汰赛阶段,后续预测将更具挑战性。AI模型腾讯混元世界杯预测AI模型推荐理由:腾讯混元29/32比其他AI猜得准,看看淘汰赛还能不能撑住。原文
00:01Google Blog: AI(博客/媒体)谷歌专家近日发文解释全栈AI方法,指出该方法包括基础设施、模型和应用三个主要层次。全栈方法确保各层协同优化,已成为谷歌长期AI工作的核心策略。行业Google全栈AIAI开发方法基础架构推荐理由:谷歌专家用大白话讲清全栈AI的脑回路,看完你就明白他们AI为啥这么强。原文
23:56Decoder@Maximilian Schreiner72°Meta已限制其工程师使用Anthropic的Claude Code和OpenAI的Codex。此举旨在防止竞争对手AI模型的输出被纳入Meta自身的训练数据集。Meta担心这些编码工具生成的代码可能污染其自家模型的训练质量。这一限制反映了科技巨头在AI训练数据来源上的激烈竞争。行业MetaClaude CodeCodexOpenAIAnthropic10 个信源在谈推荐理由:Meta不让自家工程师用对手的AI编码工具,怕污染训练数据,这波操作说明大厂之间防备心有多重。原文
23:49阶跃星辰 Stepfun@Stepfun_AI精选StepFun 的 Step 3.7 Flash 模型在 Claw-Eval General 基准测试中取得第二名的成绩,该基准用于评估自主智能体。模型在多步执行和长程任务鲁棒性上表现强劲,排名仅次于 Claude Opus 4.6。这一结果显示其在真实世界智能体工作负载中的潜力。AI模型Step 3.7 FlashClaw-Eval General智能体推理模型推荐理由:StepFun 的 Step 3.7 Flash 在智能体基准 Claw-Eval General 排第二,仅次于 Claude Opus 4.6,多步执行和长程任务都强,感兴趣可以看看。原文
23:47Decoder@Maximilian Schreiner德勤一份内部演示文件预测,到2035年,咨询业传统的小时计费模式将萎缩至仅占市场一小部分,被AI代理取代。一位顾问总结称“我们的模式完了”。麦肯锡和BCG已经在探索替代收入来源。行业DeloitteMcKinseyBCGAI代理咨询行业推荐理由:德勤自己告诉自家顾问,小时计费时代要完了,2035年AI代理上位。麦肯锡和BCG已经在找新路子了。原文
23:38IT之家(博客/媒体)Meta 于 5 月出台内部规范,限制其 AI 工程部门的工程师使用 Anthropic 的 Claude Code 与 OpenAI 的 Codex。该决定旨在防止蒸馏行为,即借助竞品模型的输出来训练自家模型,这违反了 Claude 和 Codex 的用户协议。Meta 警告称,若竞品输出渗入训练数据,可能引发与合作企业的严重纠纷。行业MetaClaudeCodexAnthropic蒸馏10 个信源在谈推荐理由:Meta怕工程师用Claude和Codex偷偷训练自家模型,直接封了,挺直接的做法。原文
23:24IT之家(博客/媒体)精选安全公司Push Security披露,黑客创建了名为"Push Security Inc"的OpenAI组织,通过官方邮箱noreply@ tm.openai.com向员工发送组织邀请邮件进行钓鱼攻击。邮件来自OpenAI且通过标准邮件身份验证,仅以一行文字提醒邀请方域名非企业域名,极易被忽略。被邀请员工默认获得Owner(所有者)权限,黑客提前绑定Visa信用卡消除付费门槛,加入流程无需额外验证。调查显示其他员工仍处待邀请状态,未发现数据泄露,Push Security已设置邮件过滤规则拦截类似邀请。行业Push SecurityOpenAI钓鱼攻击AI安全社工攻击9 个信源在谈推荐理由:Push Security发现了一种利用OpenAI组织邀请功能的新型钓鱼攻击,专门针对企业员工,连官方邮箱都能被利用,看了你就知道该怎样防范。原文
23:12berryxia@berryxiaMargot Van Laar在Code with Claude大会上分享提示词工程实战,核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景:团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合,以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中,她将复杂提示词拆成三个简单提示词(生成、评估、修复)组成循环,比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词,并务必建立量化评估基准验证改动效果。技巧AnthropicClaude提示词工程评估提示词维护8 个信源在谈推荐理由:Anthropic工程师手把手教你维护生产提示词,从客服机器人到排班Agent,拆成小提示词更靠谱,还有评估妙招。原文
23:10berryxia@berryxia精选Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践,强调通过评估(Eval)而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示:使用XML标签结构化提示词、移除旧模型遗留的禁止列表(如Claude 3 Opus)、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环,并建议用更强推理模型(如Opus)加自适应思考替代小模型复杂提示词。技巧提示词工程Claude评估Claude Opus工作流8 个信源在谈推荐理由:Anthropic工程师手把手教你怎么调客服提示词和搭Agent,用Opus加循环拆解比堆复杂指令更管用,核心就一句话:先搞评估原文
22:27IT之家(博客/媒体)美国加利福尼亚州州长加文·纽森宣布与Anthropic建立合作伙伴关系,州、市、县三级政府可以五折优惠价使用Claude系列AI工具。Anthropic还将提供免费培训和开发人员的技术支持及工作流程指导。Claude将协助政府工作人员起草文件、汇总信息、分析数据等日常任务。此前Anthropic在3月被美国国防部认定为“供应链风险”实体,6月美国商务部对Anthropic的Fable 5和Mythos 5模型实施出口管制。行业AnthropicClaude加州政府政府采购AI应用8 个信源在谈推荐理由:加州政府用五折价买了Claude,还送培训和专家指导,以后公务员办公更省力了。原文
21:17IT之家(博客/媒体)欧盟理事会今日正式批准新法案,在《人工智能法案》中增加规定,明确禁止利用 AI 生成未经同意的色情与私密内容或儿童性虐待材料。能够生成真人裸体图像或通过“消除衣物”技术暴露私密部位的 AI 系统将于 2024 年 12 月起全面禁用。法案还要求欧盟委员会提供指导方针,帮助高风险 AI 系统运营商减轻合规负担。高风险 AI 系统的合规时限推迟:独立系统延至 2027 年 12 月 2 日,嵌入产品中的系统延至 2028 年 8 月 2 日。行业欧盟AI法案AI安全高风险AI系统合规2 个信源在谈推荐理由:欧盟出了新规,明确禁止AI生成色情内容,还推迟了高风险系统的合规期限,做AI合规的值得一看。原文
21:13IT之家(博客/媒体)OpenAI 组建应急专项攻坚小组,处理大量用户反馈的 Codex 编码工具额度消耗远超往常的问题。原因在于平台防滥用风控系统错误对部分账户限流。工程负责人蒂博·索蒂奥克斯于6月29日表示已全面重置所有用户额度上限并排查故障。一名200美元套餐用户反馈,额度从一周耗尽变为一天耗尽,需手动重置。事件发生在AI服务商逐步取消不限量模式的行业背景下。行业OpenAICodex额度消耗风控系统编程助手10 个信源在谈推荐理由:OpenAI 的 Codex 额度突然变快没了?原来是风控系统误判,官方已重置并排查中,开发者可以关注后续。原文
21:08pandaily@contact@pandaily.com (Pandaily)X Square Robot 完成连续四轮融资,以 C 轮收官,估值攀升至 28 亿美元。该公司成为唯一一家同时获得中国四大互联网巨头(阿里巴巴、腾讯、百度、字节跳动)投资的具身 AI 企业。X Square Robot 专注于开发物理世界 AI 基础模型,旨在让机器人自主执行复杂操作。本轮融资凸显资本市场对具身智能赛道的高热度,资金将用于模型迭代与商业化落地。行业X Square Robot具身智能融资C轮AI基础模型推荐理由:X Square Robot 连融四轮,估值近200亿,四大巨头全投了,具身 AI 赛道真火,值得关注。原文
20:49Decoder@Maximilian Schreiner美国军方在一次对伊朗学校的导弹袭击调查中暴露了目标选择基础设施的严重缺陷。AI系统被用于筛选数千个目标,但未能识别出其中一个目标被标记为学校。这一事件揭示了AI在军事目标识别中的漏洞,导致误炸平民设施。调查指出,AI辅助系统在处理标注信息时存在盲点。行业美国军方AI目标识别误炸学校军事AI伊朗推荐理由:美国军方用AI挑目标,结果炸了学校,暴露了AI筛选系统的重大漏洞,不看细节就会出事。原文
20:47IT之家(博客/媒体)73°地平线发布全场景辅助驾驶系统HSD V2.0,基于世界模型与端到端强化学习。首批搭载车型奇瑞iCAR V27将于6月30日起分批次开放OTA升级。新版本在无接管里程上提升56%,博弈能力提升167%,反应速度提升20%。新增18项功能与25项体验优化,并将OCC网络延伸至AEB、AES等主动安全场景,提升异形障碍物识别能力。AI产品地平线HSD V2.0奇瑞辅助驾驶端到端推荐理由:地平线给iCAR V27车主推送新版HSD,无接管里程提升56%,用OCC网络防异形障碍物,比传统白名单更安全。原文
20:17@elonmusk@elonmusk特斯拉AI团队在AI3计算机上取得了良好成果。AI3的有效内存带宽仅为AI4的约15%,这使得任务极具挑战性。马斯克在X平台上发帖称赞团队工作。AI产品TeslaAI3AI4特斯拉芯片推荐理由:看看特斯拉怎么用只有AI4 15%带宽的AI3完成高难度任务,挺有参考价值。原文
20:16@elonmusk@elonmusk特斯拉FSD v14 Lite版本开始向搭载AI3硬件的车主推送,Elon Musk在X上确认了这一更新。该版本是FSD系统的轻量化版本,专注于优化性能和响应速度。目前暂无详细功能变更列表,但用户可期待更流畅的自动驾驶体验。AI产品TeslaFSDv14 LiteAI3智能驾驶推荐理由:特斯拉FSD v14 Lite来了,AI3老车主快检查更新,看看自动驾驶有什么改进。原文
20:05@zarazhangrui@zarazhangrui一位创业者分享经验:每花1小时构建产品,应投入2小时用于解释、演示、销售和教学。这一比例强调产品需要持续向外界传达并基于用户反馈迭代。指出将时间优先花在传播和沟通上,是产品成功的关键。该观点源自与现实的接触和不断打磨。技巧产品开发推广技巧创业经验时间管理推荐理由:别只顾码代码,花两倍时间去推销和教学,这才是让产品落地的硬道理。原文
19:47eric zakariasson@ericzakariasson73°Elon Musk在推文中透露,Cursor团队为v9模型的SFT和RL训练做出了重要的工程贡献。当前1.5T参数量的模型已通过补充训练加入Cursor数据。而两周前开始的2T参数量训练在数据范围和规模上大幅改进,训练配方也获得多项升级,预计7月底完成,8月发布。AI模型Elon MuskCursorv9SFTRL5 个信源在谈推荐理由:Elon Musk说他们和Cursor团队合作训练v9模型,2T参数量的版本数据更全,8月就能见到,值得关注。原文
18:57vLLM@vllm_project精选NVIDIA 与 vLLM 合作发布 step-by-step 指南,教你用四台 DGX Spark 盒子组建私有集群,自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器,可提供兼容 OpenAI 的端点。无需数据中心,适合构建私有 agent 工作流。技巧Nemotron-3-UltraNVIDIADGX SparkvLLM自托管4 个信源在谈推荐理由:想不依赖数据中心自己跑 550B 模型?NVIDIA 出了详细教程,四台 DGX Spark 就能拼出 OpenAI 兼容的端点。原文
18:51量子位@梦晨DeepSeek创始人梁文锋受Claude系列模型强劲表现影响,决定启动新一轮融资。他认为不储备弹药将无法在竞争中立足。此轮融资将为DeepSeek后续研发和算力投入提供资金支持。行业DeepSeek梁文锋Claude融资推荐理由:梁文锋因为Claude的压力决定给DeepSeek融资了,说明大模型烧钱战还要继续打。原文