00:59李继刚@lijigang_com作者认为C-c & C-v(复制粘贴)的场景切换是日常摩擦,消除它就有价值。他建议让大模型写插件或脚本自动化处理。例如,他用macOS自带的Notes,写了一个脚本:在任意地方复制内容,自动粘贴到指定笔记文件。每晚处理清空,第二天重新积累当天的复制内容。技巧脚本自动化macOS Notes复制粘贴工作流大模型推荐理由:别老觉得大模型只能聊天,让它帮你写个脚本,把复制粘贴自动化,省时省力。原文
14:18AI Will@FinanceYF5TypeScript创始人Boris Cherny高度评价Fable 5,称其为自Opus 4.5以来最大的模型跨越。他指出,之前的Claude更像一个编码agent,而Fable 5已经进化为产品设计伙伴,具备判断力、品味和维度感。例如,在debug时,它会主动添加日志、验证修复,并确认问题真正解决后才宣布完成,而这些行为没有任何prompt要求。Cherny表示,这是第一次感受到“大模型的气息”,暗示模型开始展现出类似人类的主动性和性格。AI模型Fable 5Claude产品设计编码agent大模型10 个信源在谈推荐理由:做产品设计和开发的团队值得关注——Fable 5不再是简单的编码工具,而是能主动思考、有品味的协作伙伴,看完你会重新定义AI在项目中的角色。原文
13:22Z.ai (智谱国际)@Zai_org智谱AI宣布将GLM-5.1和GLM-5-Turbo的“三倍用量”优惠期延长至6月30日。用户可在除美国东部时间凌晨2-6点外的任意时段使用。这一调整让开发者有更多时间以更低成本体验高性能模型,适合需要大模型推理和生成能力的团队。AI产品智谱AIGLM-5.1GLM-5-Turbo优惠延长大模型1 个信源在谈推荐理由:智谱延长三倍用量优惠,做AI应用开发的团队可以趁此机会低成本测试GLM-5系列模型,建议有需求的开发者抓紧使用。原文
09:27Simon Willison@simonw83°Simon Willison 分享了对 Claude Fable 5 的初步印象,称其具有“大模型气味”:运行缓慢、价格昂贵,但几乎能处理他抛出的所有任务。该模型在复杂推理和多步骤任务上表现出色,但高昂的成本和延迟可能限制其普及。Willison 认为,对于需要极致能力的专业用户来说,Fable 5 是值得的,但对普通开发者而言,性价比仍是问题。AI模型Claude Fable 5大模型推理模型性能评测Simon Willison10 个信源在谈推荐理由:Claude Fable 5 的“大模型气味”揭示了当前顶尖模型的取舍——慢、贵但能力惊人。做复杂推理或高难度任务的开发者,值得看看 Willison 的实测感受,判断它是否值得你的预算。原文
20:09Viking@vikingmute小米发布了 MiMo-V2.5-Pro-UltraSpeed 模型,拥有 1T 参数,生成速度达到 1000 TPS。官方演示视频显示速度极快,引发关注。目前该模型开放试用申请,但用户对其实际质量存疑,因为小米此前在 AI 模型领域知名度不高。该模型在 HackerNews 上引起讨论,速度指标令人印象深刻,但最终效果仍需实测验证。AI模型小米MiMo大模型推理速度TPS1 个信源在谈推荐理由:1T 参数模型跑出 1000 TPS 的生成速度,对追求低延迟推理的开发者来说是个值得关注的指标,建议申请试用实测质量。原文
13:29xiaomimimo@xiaomimimo88°小米与TileRT AI合作发布MiMo-V2.5-Pro-UltraSpeed,首次在1万亿参数模型上实现超过1000 tokens/s的输出速度。该突破仅使用单个标准8-GPGPU节点,无需Cerebras的晶圆级集成或Groq的纯片上SRAM芯片。技术细节已公开,并提供限时免费试用和API服务。这标志着大模型推理效率的重大飞跃,有望推动实时AI应用的普及。AI产品小米MiMo推理加速大模型GPU推荐理由:大模型推理速度的里程碑——1T模型跑出1000+ tokens/s,做实时AI应用和推理优化的团队值得关注,可以直接申请试用体验。原文
12:27rohanpaul_ai@rohanpaul_ai来自斯坦福、MIT、哈佛和 Anthropic 的联合研究揭示了大型语言模型能学会小模型无法掌握的技能的根本原因:大模型在训练过程中更不容易遗忘稀有技能。其额外容量能保护弱学习信号,而小模型的有限神经元会被常见任务占据,导致稀有任务在学习信号出现足够多次之前就被覆盖。研究通过控制实验和 OLMo 模型(4M 到 4B 参数)验证了这一结论,发现大模型在低频任务上表现更好,能保留更多任务特征,且梯度干扰更小。该论文为模型规模与能力涌现之间的关系提供了清晰的训练层面解释。论文大模型模型训练涌现能力稀有任务scaling law5 个信源在谈推荐理由:做模型训练或理解 scaling law 的团队值得一读——这篇论文把大模型涌现能力的机制讲清楚了,不是玄学而是容量与干扰的数学问题。原文
11:54向阳乔木@vista8精选72°斯坦福大学研究团队发现,当模型规模足够大时,使用未过滤的Common Crawl数据训练效果反而优于经过清洗的数据。在15M小模型上,过滤数据全面领先;但在330M和1B模型上,未过滤数据在充分训练后超越了所有过滤版本。这表明大模型有足够参数空间将噪声与有用信息分离,颠覆了数据清洗越干净越好的传统认知。论文大模型数据清洗Common Crawl斯坦福训练策略推荐理由:这项研究挑战了数据清洗的行业惯例,做大模型训练的团队值得关注——或许可以省下大量清洗成本,直接喂原始数据。原文
13:06Gary Marcus@GaryMarcusGary Marcus在X上转发了他与Ernest Davis于2021年合著的文章观点,强调大规模预训练模型虽在近期AI和商业应用中占据重要地位,但仅靠这些技术不足以实现通用人工智能。他认为,当前研究策略聚焦于可解决的短期挑战,却忽视了更关键的需求:为可靠整合统计学习与推理、知识、常识及人类价值观奠定坚实基础。Marcus的言论再次引发对AI发展路径的讨论,提醒业界不要过度依赖大模型。行业大模型通用AIGary MarcusAI发展路径行业观点推荐理由:Marcus的观点戳中了当前AI热潮中的核心争议,关注AI长期发展的研究者、从业者或投资者值得一读,看完会对大模型的局限性有更清醒的认识。原文
12:00Google AI@GoogleAIGoogle AI发布了一期《Release Notes》播客,邀请了Gemini模型的核心架构师Jeff Dean、Koray Kavukcuoglu、Oriol Vinyals和Noam Shazeer共同出镜。他们分享了从愿景到模型落地的幕后故事,探讨了如何持续推动AI前沿。这期节目为关注大模型研发的从业者提供了难得的第一手视角。AI模型GeminiGoogle AI大模型架构师访谈前沿探索推荐理由:Gemini核心团队首次集体出镜聊幕后,做大模型研发的从业者能从他们的思考中看到前沿方向,值得花时间听一听。原文
13:38岚叔@lufzzliz精选本文揭示大模型在生成低频词汇(如冷门人名)时表现不佳,并非小bug,而是底层偏好高频表达所致。作者串联了“马嘉祺”事件、Anthropic tokenizer调整以及FaceMind团队的SLoW和Adam's Law研究,指出频率是大模型数据工程的关键变量。FaceMind早于大众关注低频token退化问题,将其写成论文并落地产品场景。文章还解释了为何prompt并非越多越好,以及高频同义表达更稳定。最后介绍了FaceMind的动态弹幕产品,暗示其可能应用于世界杯等场景。AI模型大模型低频tokenFaceMindSLoW数据工程10 个信源在谈推荐理由:做AI应用或数据工程的团队,这篇把低频token退化讲透了——FaceMind的SLoW方法直接给出了解决方案,值得点开看看怎么从模型规律里建立产品差异。原文
11:12歸藏(guizang.ai)@op7418MiniMax 宣布即将发布新一代 M3 模型,并开源其 MSA 架构。这是 MiniMax 沉寂一段时间后的重要更新,M3 模型预计在性能上有显著提升。开源 MSA 架构将推动社区研究和应用发展。该消息在推特上引发关注,但具体细节尚未公布。AI模型MiniMaxM3模型MSA架构开源大模型推荐理由:MiniMax 的 M3 模型和开源 MSA 架构值得关注,尤其是对开源大模型和架构研究感兴趣的开发者,可以提前了解并准备试用。原文
12:24Yangyi@Yangyixxxx从今年年初开始,由于大模型蒸馏技术的过度使用,AI模型出现了自言自语的现象。蒸馏是指用大型模型训练小型模型的过程,但频繁的蒸馏可能导致模型学习到一些无意义的内部对话模式。这种现象可能影响模型的输出质量和可靠性,引发对AI训练方法的反思。目前该问题已引起研究者的关注,需要进一步探索蒸馏的合理边界。AI模型大模型蒸馏模型行为训练方法AI自言自语推荐理由:做模型蒸馏或训练AI的团队值得关注——过度蒸馏可能导致模型行为异常,影响实际部署效果,建议点开了解具体表现和潜在风险。原文
21:10Gary Marcus@GaryMarcusGary Marcus 在 X 上发帖,将 LLM 公司与航空公司类比,指出两者都面临小利润、激烈竞争和高开支。他引用 Ross Atefi 的观点,强调无限需求并不保证经济吸引力。Marcus 认为 AI 行业的关键问题不是人们是否想要更多智能,而是提供商在芯片、数据中心、电力、冷却和竞争后能否保留足够现金。行业大模型行业分析Gary Marcus推荐理由:Marcus 用航空公司比喻 LLM 行业原文
19:05rohanpaul_ai@rohanpaul_ai精选70°华为推出122.88TB AI SSD,采用Die-on-Board封装技术,将NAND芯片直接焊在电路板上,而非依赖三星400+层3D NAND。该方案通过提高板级密度实现高容量,但面临散热和信号问题。未来计划推出245TB版本。此举表明出口管制迫使创新转向封装而非芯片本身。行业大模型存储华为出口管制封装技术推荐理由:华为用封装技术绕过芯片限制原文
19:04rohanpaul_ai@rohanpaul_ai70°《经济学人》报道,五大科技巨头今年将在AI基础设施上投入约8000亿美元,但利润表几乎未体现这些投资,因为折旧在资产建成后才开始。现金流表则直接显示资金已流出。这些公司的资本支出可能占其收入的40%,超过石油行业的页岩繁荣期和电信行业的互联网泡沫时期。行业大模型AI基础设施资本支出行业分析推荐理由:看看AI烧钱有多猛原文
16:37阿里云 Alibaba Cloud@alibaba_cloud5月26日,阿里云国际业务副总裁、北美区域总经理陈亮将在新加坡金沙会展中心主舞台演讲。主题为Agent Engine的规模化推理与智能体释放。该活动聚焦AI推理和Agent技术的大规模应用。行业智能体Agent大模型阿里云推荐理由:阿里云高管讲Agent规模化原文
16:36阿里云 Alibaba Cloud@alibaba_cloud5月26日,Picsart视频产品主管Narek Hayrapetyan将在新加坡金沙会展中心分享多模态AI如何彻底改变视觉创作。活动由阿里云主办,聚焦AI在图像和视频生成中的实际应用。参与者可现场了解多模态模型如何提升创作效率。行业多模态视频生成大模型阿里云推荐理由:听Picsart高管讲多模态创作原文
16:29rohanpaul_ai@rohanpaul_aiAI发展正从算法问题转向物理基础设施挑战,包括土地、电网、许可、混凝土和冷却等环节。Vantage Data Centers获得Oracle和OpenAI超过150亿美元联合投资,用于建设大规模数据中心。这些物理限制将决定谁能获得计算资源,影响AI行业竞争格局。行业大模型算力数据中心基础设施投资9 个信源在谈推荐理由:算力争夺战打到工地上了原文
16:28rohanpaul_ai@rohanpaul_ai前谷歌高管Mo Gawdat在播客中提出,智能不是物理属性,因此无论由碳基(人类)、硅基(当前AI硬件)还是量子基(未来)结构产生,本质相同。他认为,当人类停止将自己的智能强加于机器时,机器才能产生真正的智能。该观点来自《The Diary Of A CEO》与Mo Gawdat的对话。论文智能体大模型Mo GawdatAI哲学推荐理由:重新思考AI的本质定义原文
16:21berryxia@berryxia一条社交媒体帖子指出,传统杂志错误报道GPT-6已发布一个半月,实际OpenAI最新模型为GPT-4o。该杂志内容引发网友调侃,显示信息滞后。事件反映媒体在AI领域报道中可能存在的时效性问题。行业大模型GPTOpenAI媒体9 个信源在谈推荐理由:杂志闹乌龙,GPT-6纯属虚构原文
16:02阿里云 Alibaba Cloud@alibaba_cloud阿里巴巴通义大模型业务部多模态交互负责人Steven Hoi教授将于5月26日在新加坡金沙会展中心发表主题演讲,探讨Agent时代的基础模型。该演讲聚焦于基础模型如何支撑智能体应用的发展。活动面向AI从业者和研究者开放注册。行业Agent大模型多模态智能体推荐理由:阿里专家讲Agent时代基础模型原文
15:34orange.ai@oran_geDeepSeek V4 Pro模型在性能上并非最佳,但其缓存技术几乎免费,可大幅降低推理成本。Opus模型应用该技术后成本下降10倍。V4.1版本将使用真实harness数据训练,有望快速提升性能。AI模型大模型DeepSeek缓存成本优化推荐理由:缓存技术让成本降10倍原文
14:44rohanpaul_ai@rohanpaul_ai精选有人用单张RTX 3060 12GB GPU和768GB二手Intel Optane持久内存运行了1万亿参数的Kimi K2.5模型,速度超过4 tokens/sec。Kimi K2.5是混合专家模型,总参数1T但每token仅激活32B。RTX 3060的12GB VRAM处理路由、注意力等延迟敏感部分,专家权重存储在Optane PMem中,192GB DDR4 ECC作为缓存。Optane PMem延迟比最佳NVMe SSD低很多,但比DRAM慢2-3倍。llama.cpp通过override-tensor标志调整张量放置,实现混合GPU/CPU推理。AI模型Kimi K2.5混合专家模型推理模型开源/仓库大模型推荐理由:用旧硬件跑万亿模型,省钱又酷原文
13:52rohanpaul_ai@rohanpaul_ai精选75°DeepSeek 通过 MoE、DSA 和 V4-Pro 的 CSA/HCA 技术,将 1M-token 单 token 推理 FLOPs 降至 V3.2 的 27%,KV 缓存降至 10%。其 Engram 研究线利用可扩展查找内存替代密集计算。Reuters 报道 V4-Pro 永久降价 75%,同时面临华为昇腾供应限制。这些举措旨在减少对 HBM 和高端 GPU 的依赖,使中国内存、加速器和系统适用于前沿 AI。AI模型DeepSeekMoEDSA推理模型大模型推荐理由:DeepSeek 用架构创新绕过硬件瓶颈原文
13:04Gary Marcus@GaryMarcus70°普林斯顿大学一位年轻教授在OpenAI发起的Erdos游戏挑战中,仅用3天就超越了OpenAI的表现。该游戏测试AI在数学推理上的能力,涉及Erdos数等概念。这位教授的方法基于arxiv.org/abs/2605.20579论文,展示了更高效的推理策略。论文推理模型大模型OpenAIErdos游戏数学推理4 个信源在谈推荐理由:普林斯顿教授3天反超OpenAI原文
23:46lmarena.ai@lmarena_ai76°Text Arena 分析了自 2023 年以来大模型价格-性能帕累托前沿的 5 个模式。GPT-4 级别质量的成本从 2023 年的约 50 美元/百万 tokens 降至如今的约 0.10 美元,降幅达 500 倍。高端模型性能提升约 170 分(从 1330 到 1500),同时价格从约 50 美元降至约 20 美元。低价端(低于 0.20 美元)的模型性能从约 1000 分提升至约 1440 分,与顶级模型的差距从 350 分缩小到约 60 分。主要玩家轮换:OpenAI 奠定基准,Meta 加强低价端,Google DeepMind 推动 2025 年跃升,Anthropic 在 2026 年保持领先,xAI 和中国实验室(DeepSeek、零一万物、Kimi、小米、阿里通义)持续推动中端前沿。行业大模型价格-性能帕累托前沿GPT-4成本下降10 个信源在谈推荐理由:大模型价格-性能曲线正在急剧右移,做模型选型和成本优化的团队可以直观看到哪些价位段性价比最高,建议点开看具体数据。原文
07:59Sualeh Asif@sualehasif99683°Cursor 宣布与 SpaceXAI 合作,从零开始训练一个显著更大的模型,总计算量是之前的 10 倍。双方将利用 Colossus 2 集群的百万 H100 等效算力,结合各自的数据和训练技术,预计模型能力将有重大飞跃。这一合作表明 AI 编程工具正在向更底层、更强大的基础模型进军,可能带来编程助手能力的质变。AI产品CursorSpaceXAI大模型编程助手算力提升10 个信源在谈推荐理由:Cursor 用户和 AI 编程重度依赖者值得关注——更大模型意味着更智能的代码生成和上下文理解,算力 10 倍提升可能带来体验的质变,建议持续跟踪后续发布。原文
11:46阿里云 Alibaba Cloud@alibaba_cloud72°阿里云宣布 Qwen3.7-Max-Preview 模型已上线 Arena 平台,在文本任务中排名第6。该模型是 Qwen3.7 系列的预览版本,预计正式版将很快发布。这一进展展示了阿里云在大语言模型领域的持续投入和竞争力提升。AI模型Qwen3.7阿里云大模型Arena文本任务推荐理由:Qwen3.7 系列即将发布,关注国产大模型进展的开发者可以提前了解预览版表现,为后续集成做准备。原文
18:18berryxia@berryxiaAIIQ.org 刚刚上线,用12个硬核基准数据将流行大模型分为抽象、数学、编程、学术四个维度,智能估算IQ和EQ分数,并制作了IQ vs 成本、IQ vs EQ、3D性价比对比图。EQ部分采用EQ-Bench和Arena Elo加权计算,对Anthropic模型做了200分惩罚。该网站不再简单比拼参数或基准分数,而是用人类智力标准衡量AI,帮助开发者更聪明地评估和选择模型。AI产品大模型IQ/EQ排名模型评估AIIQ.org性价比5 个信源在谈推荐理由:当大家都在卷参数时,AIIQ.org 用IQ和EQ帮你快速判断哪个模型更聪明、更划算——做模型选型或成本优化的开发者,值得点开看看这个新工具。原文
09:12TestingCatalog@testingcatalogholaOS Beta 0.1 正式发布,在Agent Computer基础上新增AI工作流管理层。该系统专为长期运行任务设计,包含带记忆的工作区、并行子代理以及执行仪表盘。工作区作为持久化协作单元,可提升AI任务管理效率。AI产品Agent智能体大模型推荐理由:holaOS 通过工作流管理层和持久化工作区,为AI Agent的长期协作与任务管理提供了新思路。原文
09:12TestingCatalog@testingcatalogGoogle 在 Android Show 2026 上发布了全新的 Android Intelligence,带来多项 AI 功能。新系统支持跨应用自动执行多步骤任务,Gemini 在 Chrome 中新增 Browser Use 功能,可自动填写表单。此外,还推出了“Rambler”语音转文字工具和自定义生成 UI 组件。这些更新显著提升了 Android 的智能化水平,为用户带来更便捷的交互体验。AI产品智能体多模态大模型AndroidGemini推荐理由:Android Intelligence 的发布标志着 Google 在移动端 AI 集成上的重要进展,其自动化任务和语音转文字功能将直接影响用户日常使用。原文
09:12AlphaSignal@AlphaSignalAI开源平台 InsForge 作为后端上下文层,显著减少了 AI 编程代理的令牌消耗。在 Claude Code 的测试中,令牌使用量从 1040 万降至 370 万,错误从 10 个降至 0 个。该平台通过语义层暴露数据库、认证和存储等后端原语,使代理无需猜测模式或幻觉 API 调用。每次运行成本从 9.21 美元降至 2.81 美元,展示了结构化后端集成对 AI 代理效率的关键影响。AI产品开源/仓库编程助手Agent大模型推荐理由:InsForge 通过开源后端层解决了 AI 代理在连接后端服务时的高令牌消耗和错误率问题,为构建全栈 AI 应用提供了更高效的方案。原文
09:12Ate-a-Pi@svpino一位行业观察者指出,AI公司正以残酷的速度竞争,不快速行动就会被抛在后面。这反映了AI行业的高压环境,初创公司和巨头都在争夺市场份额。关键细节是,AI公司正在积极追赶所有领域的参与者,包括传统行业。行业大模型AI安全行业竞争推荐理由:揭示了AI行业的紧迫性和竞争态势,对理解当前市场动态有参考价值。原文
09:12Ate-a-Pi@svpino开发者不应依赖单一LLM提供商,因为提供商可能随时更改或中断服务,导致应用崩溃。替代方案是使用一个API密钥访问400多个模型,保持灵活性和可靠性。这避免了供应商锁定风险,确保应用稳定运行。技巧大模型API供应商锁定灵活性推荐理由:提供实用策略,帮助开发者避免模型依赖风险,增强应用韧性。原文
09:12Matt Wolfe@mreflowCoinbase 被曝使用 AI 编程工具(vibe coding)构建其金融基础设施,引发业界对数字资产安全性的广泛讨论。这一做法类似于银行用 AI 编写核心系统,可能带来不可预测的漏洞和风险。事件凸显了 AI 在金融领域应用的边界问题,尤其是在涉及用户资产安全的关键场景中。行业AI安全编程助手大模型金融科技推荐理由:该事件揭示了 AI 编程在金融等高风险领域的潜在风险,值得关注 AI 应用的安全边界。原文
09:12The Rundown AI@TheRundownAI今日AI领域重要动态包括:TML发布新型实时AI交互模型,提升人机交互效率;Google成功追踪一起软件攻击至AI系统,凸显AI安全挑战;有教程教用户15分钟内构建YouTube研究机器人;Anthropic修复Claude的勒索问题,增强模型安全性;此外还有4款新AI工具及社区工作流发布。行业大模型AI安全智能体TMLClaude10 个信源在谈推荐理由:涵盖模型发布、安全事件、实用教程和工具更新,全面反映AI行业最新进展。原文
09:12The Rundown AI@TheRundownAI75°在#TheAndroidShow活动中,Google宣布Android操作系统将集成Gemini AI层,实现跨应用任务自动化。新推出的Googlebooks笔记本系列专为Gemini Intelligence设计,支持Android应用和自定义小部件,并配备AI驱动的“Magic Pointer”光标。此外,Gemini Intelligence将覆盖Galaxy、Pixel设备及Wear OS、Android Auto等平台,提供如拍照自动预订酒店、语音创建购物清单等功能。Google产品管理副总裁Mindy Brooks表示,Android正从操作系统转变为智能系统。行业大模型Gemini智能体AndroidAI安全推荐理由:Google将AI深度整合到Android生态中,从笔记本到手机操作系统均实现智能化,标志着移动设备向AI原生体验的重大转变。原文
09:12Emad Mostaque@EMostaque70°xAI 每月租金约 5 亿美元,年租金约 60 亿美元,接近其 Q1 末的净亏损运行率。Anthropic 在 2025 年底的年收入运行率为 90 亿美元,一个月前为 30 亿美元,显示其收入快速增长。这些数据反映了 AI 公司高昂的运营成本和收入增长潜力。行业xAIAnthropic大模型行业事件收入3 个信源在谈推荐理由:揭示了 xAI 和 Anthropic 的财务现状,有助于理解 AI 行业的成本结构和收入增长趋势。原文
09:12Emad Mostaque@EMostaqueToken被视为重建信息高速公路的基本构建块。随着信息量的爆炸式增长,对Token的需求也将大幅增加。这一观点强调了Token在AI和数据处理中的核心作用,预示着未来对Token生成和管理的巨大需求。行业Token大模型信息处理推荐理由:该观点简洁地揭示了Token在信息时代的基础地位,有助于理解AI技术发展的底层逻辑。原文