09:02向阳乔木@vista8开发者vista8开发了一个MCP连接器,让网页版ChatGPT能够读取本地文件。当Codex额度用光且无法重置时,可以通过此MCP继续使用ChatGPT进行开发,变相获得双倍Codex额度。安装命令为npm install -g @waishnav/devspace,需在ChatGPT设置中开启开发模式并添加MCP。此方法适用于GPT-5.5 Pro、xHigh等模型,也可用于审查其他本地编码代理写的代码。技巧MCPChatGPTCodex编程助手推荐理由:vista8分享了一个小技巧,用MCP让ChatGPT网页版读取本地文件,Codex额度用完还能继续用,相当于白嫖双倍额度。原文
08:58Simon Willison@simonwSimon Willison将Claude Artifacts的概念移植到Datasette中,使用户能创建HTML+JS应用并通过JSON API访问全功能关系数据库。该方式保留了Artifacts的交互能力,同时支持任意形状和大小的数据存储与查询。项目提供了一个可公开访问的示例,展示了与Datasette生态的深度整合。技巧Claude ArtifactsDatasetteJSON API数据库工具推荐理由:Simon把Claude Artifacts的交互思路搬到Datasette上,用JSON API操作数据库,做应用更方便了。原文
08:29@koltregaskes@koltregaskesOpenAI推出新功能,但未支持Windows平台,也不向英国和欧盟用户开放。该功能似乎并非移动端特性。此前电脑端功能等待时间不长,用户期望此次也能尽快扩展覆盖。行业OpenAI地区限制Windows英国欧盟10 个信源在谈推荐理由:OpenAI又发新东西了,不过这次Windows用户、英国和欧盟的朋友先别激动,暂时用不了。看看吐槽。原文
08:05HeyGen@HeyGen_OfficialHeyGen 的 Hyperframes 多模态 AI 产品将于 6 月 24 日(周三)在东京涩谷举办首次线下活动。活动内容包括 HyperFrames 的现场演示、Q&A 环节,以及与多模态 AI 前沿开发者的交流。现场提供 AI 翻译服务,参会者无需担心语言障碍。AI产品HyperframesHeyGen东京多模态AIAI翻译推荐理由:HeyGen 把 Hyperframes 带到东京了,6月24日涩谷能现场体验、跟开发者聊天,还有 AI 翻译,别错过。原文
07:58@LumaLabsAI@LumaLabsAILuma Labs 推出 Luma Skills,可将你的创意资产(如图像、3D 模型)转化为一个系统,生成数百个符合产品要求的概念。用户需在 Luma Agents 中上传创意 DNA 并构建 Skill,即可将其变为可重复的工作流。该功能适用于快速概念迭代或客户交付场景,支持从灵感直接进入制作阶段。AI产品Luma LabsLuma SkillsLuma Agents工作流创意生成推荐理由:Luma Labs 的新技能,让你把创意资产变成反复用的工作流,一键生成几百个精准产品概念,适合快速出图或改稿。原文
07:44orange.ai@oran_ge86°OpenAI发现对齐大模型时存在涌现失调现象,即坏行为会泛化。他们反向实验用RL训练模型诚实、谦逊、可纠正等特质,仅混入小部分此类数据。结果在训练领域内模型变得更诚实透明;在44个独立评测(未见过)中,欺骗、谄媚、有害建议等行为全面下降,即使只用健康数据训练,非健康领域也受益。模型在对抗性提示和恶意微调下更坚韧,正常指令仍可听从。论文OpenAIRL涌现失调对齐AI安全10 个信源在谈推荐理由:OpenAI这篇论文反直觉:用RL教模型做好事,坏行为自己就减少了。实验覆盖44个新场景,效果还抗攻击。值得一看。原文
07:43Cognition@cognition_labsCognition 宣布将安全审查集成到 Devin Review 中。每次开发者提交 PR 时,Devin 自动运行安全扫描,识别那些传统漏洞扫描器遗漏的安全问题。Devin 还会为每个漏洞提供详细解释,并自动生成修复代码。该功能旨在帮助团队在不增加额外工作量的情况下提升代码安全性。AI产品DevinCognition安全审查漏洞修复编程助手推荐理由:Devin 现在能自动帮你审计 PR 里的安全漏洞,发现那些扫描器漏掉的,还直接给修复方案,省心。原文
07:31elvis@omarsar0/youtube-notetaker 是一个开源智能体技能,能从 YouTube 视频自动生成包含幻灯片、笔记和转录的 Artifacts。项目托管在 xgo.ing 平台,用户可自由定制。该技能通过单条命令 /youtube-notetaker 触发,捕获视频中的关键信息。目前已有 1405 次浏览和 24 次点赞,社区反响积极。技巧/youtube-notetakerYouTubeArtifacts智能体开源工具推荐理由:想自动从 YouTube 视频提取重点?试试这个开源智能体 /youtube-notetaker,一键生成笔记、幻灯片和转录,还能自己改。原文
07:11OpenAI@OpenAIOpenAI通过少量训练数据使模型在53项独立评估中的44项上取得改进,涵盖欺骗、奖励黑客、安全、健康、心理健康等领域。该表现优于计算匹配的基线模型。评估涉及多种领域、任务格式和评分方案。论文OpenAI对齐AI安全模型训练10 个信源在谈推荐理由:OpenAI发现用一点额外数据就能让模型在超多对齐测试里变好,覆盖欺骗、安全、健康等方面,挺牛的。原文
07:10OpenAI@OpenAIOpenAI在真实对话中训练模型,通过强化学习强化诚实、谦逊、开放纠正、公平和关怀人类福祉等特质。该训练覆盖健康、科学、教育等12个领域,旨在提升模型的对齐与安全性。方法基于RLHF改进,专注对话场景中的具体行为。AI模型OpenAI强化学习AI安全对齐模型训练10 个信源在谈推荐理由:OpenAI训练模型时不止看能力,还用强化学习专门教它诚实、谦逊、愿意接受批评,覆盖12个领域,对AI安全性很有意义。原文
07:06Greg Brockman@gdbOpenAI o1推理模型公布后,其他实验室研究者认为这是战略失误,应保密以拉开差距。Noam Brown引用研究表示,公开o1有助于推动医学推理领域的进展。这验证了OpenAI开放模型的正确性,加速了推理范式的应用。AI模型OpenAIo1推理模型医学公开研究10 个信源在谈推荐理由:Noam Brown聊了OpenAI开放o1背后的争论,告诉你为什么公开反而能让医学推理进步更快。原文
06:40Stanford AI Lab@StanfordAILab精选斯坦福AI实验室发布M*运行时,用于统一服务多模态模型。相比专业系统,M*在omni TTS任务上提速2.7倍,在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。AI产品M*斯坦福多模态运行时推荐理由:斯坦福新发的M*运行时,一个系统就能搞定各种多模态模型,速度比专业方案快2到12倍,值得做部署的看看。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
06:37OpenAI@OpenAIOpenAI 发布声明称,这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境,使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分,尚未披露具体模型或基准测试结果。AI模型OpenAIAI安全对齐10 个信源在谈推荐理由:OpenAI 开始教模型把好习惯带到新场景,让AI更靠谱。这个对齐实验挺关键,关注未来进展。原文
06:25Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue认为,事后API护栏无法消除模型的危险能力,只能隐藏在脆弱的接口后面,容易被越狱(jailbroken)。他建议不要训练高风险能力,除非有强评估、理由和遏制措施;采用分阶段发布(staged release),从可信测试者到更广泛访问,并开放发布以透明和问责。他呼吁大力支持开源AI,缩小封闭实验室和政府之间的能力差距;推动独立评估,而非信任黑盒API;赋予执法、法院、监管者、审计员、记者和公民社会强大的AI工具来检测和追究非法使用。行业AI安全开源模型独立评估分阶段发布API护栏推荐理由:Hugging Face CEO提出一个务实的AI安全路线:别只靠事后护栏,要加强独立评估、分阶段发布和开源生态。原文
06:22OpenAI@OpenAI73°OpenAI发布新研究,旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域,并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性,论文名为《Beneficial RL》。研究通过强化学习框架,让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为,而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。论文OpenAIAI安全智能体强化学习10 个信源在谈推荐理由:OpenAI发了篇新论文,研究怎么让AI在超出训练场景的长期任务里也乖乖做好事,关心AI安全的朋友可以看看。原文
06:13cat@_catwu72°Claude Team 与 Claude Enterprise 用户现可通过 Claude Code 部署 HTML 网站并与团队成员分享。新功能 Artifacts 能从会话中生成交互式页面,例如 PR 审查或项目仪表板,并通过私有链接共享。该功能目前以公测形式提供给 Team 和 Enterprise 计划。Artifacts 改变了内部沟通方式,适用于架构变更、数据分析和原型展示。AI产品ClaudeClaude CodeArtifacts团队协作HTML部署推荐理由:Claude Code 出了 Artifacts,可以在团队里建交互页面并分享私有链接,做 PR 审查或项目仪表板特别方便。原文
06:02Dify@dify_aiDify指出企业AI项目常犯的错误是花数月时间重建模型编排、知识检索、监控、权限等底层平台。一个生产就绪的AI平台应直接提供模型灵活性(可切换供应商)、内置RAG(基于自有数据)、工作流编排(业务人员可读)以及监控与访问控制。这样IT团队就能专注交付业务价值,更快将更多应用推上线。技巧Dify企业AIAI平台RAG工作流编排推荐理由:Dify告诉你别重复造轮子,用现成平台更快把AI应用推上线,专注业务价值少踩坑。原文
05:34宝玉@dotey精选76°Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能,可将终端会话内容(如 PR 走查、调试时间线、发布清单)生成实时更新的私有网页,团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文(包括代码库、外部工具和对话内容)自动更新,历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放,个人用户暂时无法使用。AI产品Claude CodeArtifactAnthropic团队协作编程助手10 个信源在谈推荐理由:Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友,不用再口述解释 agent 做了什么,适合团队协作。原文
05:16Ate-a-Pi@svpino一个AI代理产品允许用户直接标记目标并用自然语言下达指令,无需学习任何提示词技巧或理解工作原理。用户只需说出需求,代理即可自动执行并回答。这种零门槛交互方式大幅降低了AI使用门槛,使得更多非技术用户能够轻松上手。该产品因简单易用而逐渐流行起来。技巧智能体自然语言交互零门槛推荐理由:这个AI代理不用学提示词,直接说话就行,效率拉满。原文
05:14Ate-a-Pi@svpinoCheckmarx对2350名工程师的调查显示,依赖AI生成代码的公司漏洞部署率是较少使用AI公司的3.4倍。96%的开发者使用安全工具,但仅9%的公司能在三个月内修复90%以上已发现的漏洞。75%的团队承认曾发布明知有缺陷的代码,30%因认为无人发现而为之。报告指出AI生成代码的安全隐患已成为严重问题。行业CheckmarxAI生成代码漏洞安全工具AI安全推荐理由:Checkmarx报告用数据告诉你:AI写代码虽快,但漏洞风险飙升,别只图效率忽视安全。原文
05:13Ate-a-Pi@svpinoViktor是一个专为Microsoft Teams设计的AI员工。用户可以直接在Teams频道中要求它拉取数据并生成摘要。Viktor能自动拉取结果、撰写分析报告,并将内容发布到频道中。它让团队协作中的信息汇总变得自动化。AI产品Microsoft TeamsViktor智能体数据分析1 个信源在谈推荐理由:Viktor这个AI员工能在Teams里自动拉数据、写分析、发报告,跟真实同事一样高效。原文
05:12Ate-a-Pi@svpino用户在 Mac 使用 17 年后,尝试在 Framework 13 Pro 笔记本上全职使用 Omarchy Linux 发行版 90 天,已满 30 天。他喜欢 Hyprland 平铺窗口系统和完全可自定义的配置(所有设置保存在文本文件中),并提到 Claude Code 能有效辅助系统配置。但 Omarchy 仍有不少 bug,音频和蓝牙体验不佳,许多专业应用及外设驱动缺乏 Linux 版本,且缺少 AirDrop、Continuity 等苹果生态功能。他感觉操作速度远超鼠标,但日常小问题仍让他怀念 Mac。技巧LinuxOmarchyHyprlandFramework 13经验分享推荐理由:想换 Linux 但担心体验?看看这位老 Mac 用户 30 天的真实吐槽和爽点,全是细节。原文
05:07GitHub@github精选MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优,在其尺寸下提供最佳质量。早期测试中,它超越其他小模型。AI模型MAI-Code-1-FlashMicrosoftGitHub Copilot编程助手推荐理由:微软把专为 Copilot 调的小模型放到命令行了,代码质量比别的小模型好,试试吧。原文
05:01a16z@a16za16z合伙人Anish Acharya在纽约证券交易所发表观点,认为AI能让消费者在医疗、养老等领域获得更多信息与自主权,减少次优决策。他指出这项技术不仅带来经济效益,更是亲社会的技术,能促进人类福祉。Acharya强调,从细节看AI已经在这样做了。行业a16zAnish AcharyaAI赋能消费者社会影响推荐理由:听听a16z大佬怎么说AI让普通人掌握主动权,尤其医疗养老这些老大难问题。原文
04:40Greg Brockman@gdb精选OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流(如填写费用报告或提交休假申请),系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。AI产品CodexOpenAIRecord & Replay工作流自动化AI编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了个新玩法:你演示一次操作,它就能学会并复用,比如填报销单。还能编辑保存的技能,挺实用。原文
04:33Marc Andreessen@pmarcaPew Research Center最新数据显示,约50%的美国成年人报告使用AI聊天机器人,较2024年夏季(约30%)大幅上升。其中25%的用户每天使用这些工具,表明AI聊天机器人正快速普及。该报告基于2026年的调查,反映了AI技术从少数用户向主流社会的渗透速度之快。行业Pew Research CenterAI聊天机器人采用率行业报告推荐理由:Pew的调查数据告诉你,AI聊天机器人普及有多快:半年内用户翻倍,每天都有1/4美国人在用。原文
04:32The Rundown AI@therundownaiOpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作,利用自家IP(米奇、冰雪奇缘、汽车总动员)训练AI,旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具,该工具能为小广告主生成完整电视广告(包括脚本、视频和音乐)。该工具主要面向预算有限、无法负担创意代理的小型企业。行业DisneyOpenAIAdobe广告生成视频生成10 个信源在谈推荐理由:迪士尼不跟OpenAI玩了,自己联手Adobe用经典IP训练AI,还要出广告生成工具,挺实在的。原文
04:32宝玉@dotey精选73°OpenAI Codex 桌面端新增 Record & Replay 功能,允许用户在 Mac 上录制一系列操作,Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS,欧盟地区不可用,使用前需开启 Computer Use。该功能旨在简化日常重复性任务,如报销填单、发布视频、创建 issue 等。录制完成后,用户可在新对话中调用 Skill 并传入不同参数,由 Codex 结合 Computer Use、浏览器和插件自动执行。AI产品OpenAI CodexRecord & ReplayComputer Use自动化智能体10 个信源在谈推荐理由:OpenAI Codex 这次不用你写指令了,Mac 上演示一遍操作就能生成可复用的 Skill,下次改改参数自动跑,报销填单之类的好用了。原文
04:31Latent.Space@latentspacepod73°AMP 创始人 Anjney Midha 在播客中分享 Google 内部将 95% GPU 利用率视为“故障”的标准,指出单纯购买更多 GPU 已非 AI 竞争核心。他介绍 AMP 正推动将 FLOPs 像兆瓦级电力一样调度,并警告数据中心阻力可能成为 AI 最大瓶颈之一。同时分析 Anthropic 通过独特文化和准备在编码领域取得突破,DeepMind 的研究囤积导致市场失灵,强调下一个前沿属于能在计算、资本、文化和科学上“最大化输出”的团队。行业AnthropicDeepMindAMPGPU数据中心计算效率10 个信源在谈推荐理由:想知道为什么买更多 GPU 不灵了?Anthropic 是怎么靠文化和准备搞定编码的?AMP 创始人讲得特别透,全是内行视角的干货。原文
04:25Clement Delangue@ClementDelangue精选Poolside 发布了其最新模型 Laguna M.1,拥有 256K 上下文长度。该模型采用 Apache 2.0 许可,权重已开放至 Hugging Face。包括基础版和微调版检查点可供下载。AI模型PoolsideLaguna M.1Hugging Face开源模型长上下文2 个信源在谈推荐理由:Poolside 把最强的 Laguna M.1 模型完全开放了,256K 上下文,Apache 2.0 许可,直接去 Hugging Face 下载权重用。原文
04:21Cursor@cursor_ai精选/automate 是 Cursor 新推出的智能体技能,用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具,无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。AI产品Cursor/automate智能体自动化自然语言5 个信源在谈推荐理由:Cursor 新技能,说句话就能让智能体帮你配自动化流程,省掉写代码的麻烦。原文
04:20Cursor@cursor_ai精选Cursor 发布了新更新,新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用(computer use)能力,可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。AI产品CursorGitHubCloud Agents编程助手自动化6 个信源在谈推荐理由:Cursor 给云端智能体加了电脑操控能力,还能用 GitHub 事件自动触发,做自动化工作流很方便。原文
04:09a16z@a16za16z GP Anish Acharya 在纽约证券交易所的访谈中指出,非程序员过去只能通过 YouTube 成为创作者,现在 AI agents 让他们能凭借非技术背景开发软件。他认为这是被低估的新现象,将很快出现。该观点源于对青少年数字创业趋势的观察,强调 AI 降低了软件开发门槛。行业a16zAI agents非程序员创业数字创业推荐理由:a16z 投资人点出了 AI agents 的核心价值:让不会写代码的人也能做软件创业,不再只依赖 YouTube 当网红。原文
04:08Aravind Srinivas@AravSrinivasAravSrinivas在X上发推指出Context graphs是企业部署智能体框架的最佳方案。推文获得34次转发、19条评论、354个点赞。他指出许多公司存在跨工具上下文碎片化问题。自改进、自组织的全局视图能够捕获隐性知识。推文还获得84次收藏和18123次查看。行业上下文图智能体企业AI隐性知识推荐理由:Perplexity CEO说,用上下文图把公司散落的工具信息整合起来,还能自学习,组智能体更好用。原文
04:07Amjad Masad@amasadReplit 宣布集成到 Slack,通过 Slackbot 的 MCP 客户端,用户可以在聊天中直接使用 Replit 构建应用。该客户端已支持超过 20 个合作伙伴应用,包括 Amplitude 实时图表、Linear 任务更新和 Canva 设计创建。所有操作无需离开对话界面,支持多人协作。AI产品ReplitSlackMCP/工具编程助手4 个信源在谈推荐理由:Replit 现在跟 Slack 打通了,不用来回切换,直接在聊天框里写代码、拉数据、改任务,太方便了!原文
04:02Browser Use@browser_useBrowser Use发布了B浏览器代理模板,基于Eve by Vercel构建。该模板使用Browser Use Cloud浏览器和browser-harness,支持实时浏览。用户只需简单配置即可快速部署一个可运行的浏览器代理。示例展示了从创建到运行的完整流程。技巧Browser UseBEve浏览器代理部署推荐理由:Browser Use搞了个浏览器代理模板B,几分钟就能部署,还能实时看它上网干活,超简单。原文
04:02lmarena.ai@lmarena_ai82°Agent Arena推出了因果追踪方法论,通过分析人类与AI代理协作的追踪数据来量化协作的真实价值,并能观测到广泛的模型行为。基于该方法的新排行榜显示,GLM-5.2 (Max)进入前十,成为最强开源模型,确认成功率比基线高+9.4%,表扬-抱怨比高+14.9%。Claude Fable 5在几乎所有指标上曾排名第一,但因美国政府指令暂停访问。排行榜基于数百万个真实世界长期代理任务,使用因果追踪评估模型相对于平均模型的表现。AI模型Agent ArenaGLM-5.2Claude Fable 5Anthropic智能体10 个信源在谈推荐理由:想看看人机协作到底有没有用?Agent Arena拿数据说话,GLM-5.2开源最强,Claude Fable 5刚登顶就被叫停,这瓜值得吃。原文
03:46Jeff Dean@JeffDean73°Jeff Dean宣布一篇将发表于IEEE Micro 2026年7/8月刊的论文,详细回顾Google从TPU v2到Ironwood共五代训练超算的架构演变。论文披露TPU每芯片每瓦TFLOPS提升了约30倍,每个pod的芯片数从TPU v2的256颗扩增至Ironwood的9216颗。冷却方式从风冷(TPU v2)转为水冷(TPU v3起),互连从2D torus升级为3D torus。论文还指出工作负载已大幅转向Transformer模型。论文TPUGoogleIronwoodAI芯片能效1 个信源在谈推荐理由:想看TPU五代真实进化数据和能效提升细节?这篇论文从256芯片到9216芯片、从风冷到水冷、30倍每瓦算力提升,全是硬货。原文