02:45Gary Marcus@GaryMarcus据FT报道,Google因计算资源短缺限制了Meta对Gemini的使用。报道指出Google在向Meta出售Gemini时无法像预期那样自由。计算能力仍是AI领域最稀缺的资源。行业GoogleMetaGemini计算资源推荐理由:Google资源不够,连Meta都用不上Gemini了,这背后是算力争夺战。原文
02:45Harrison Chase@hwchase17LangChain宣布推出DeepAgents Harness,作为测试智能体行为的框架(harness)。同时提供LangSmith Sandboxes用于安全隔离的执行环境,以及面向LLM输出的评估(Eval)功能。这些组件集成主流模型提供商,并通过LangSmith Engine驱动“模型-测试-沙箱-评估”闭环。该方案旨在帮助企业基于自身领域知识和客户工作流,自主构建和优化智能体系统。AI产品LangChainDeepAgentsLangSmith智能体评估推荐理由:LangChain把智能体测试、沙箱和评估整合到一起了,企业可以自己掌控从模型选择到部署的全流程,不用再拼凑各种工具。原文
02:15Lenny Rachitsky@lennysanOpenAI的Codex桌面应用程序周活跃用户已突破500万,自2月以来使用量增长了6倍。几乎100%的OpenAI员工(不仅是工程师)都经常使用Codex。团队负责人Andrew Ambrosino的目标是打造“有史以来最好的桌面应用”。他认为如果在2024年11月而非2月推出,同一产品可能因模型能力不足而失败。AI产品CodexOpenAI桌面应用ChatGPT10 个信源在谈推荐理由:OpenAI Codex现在周活500万+,几乎全员都在用,负责人还分享了为什么晚几个月发布反而更成功,值得看。原文
01:45AI产品黄叔@PMbackttfuture用户使用Hermes生成手机壁纸,并将微信Agent入口交回Hermes,同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时,内容会同步到flomo,并立即触发即时增强功能,从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。技巧HermesflomoMCP/工具工作流智能体推荐理由:教你给AI设个微信入口,用Hermes做壁纸,还能自动同步到flomo,随时调取记忆,挺实用的。原文
01:42OpenRouter@OpenRouterAIOpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准,并将结果公开。这些成绩被用于其 AutoExacto 元基准,后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。技巧OpenRouterGPQATAU-BenchAutoExacto基准测试推荐理由:选模型路由工具前,看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名,现在 Parasail 和 Zai 排第一,挺有参考价值。原文
01:31vLLM@vllm_project精选百度Unlimited-OCR现已集成到vLLM推理框架中,基于Reference Sliding Window Attention(R-SWA)机制实现恒定KV缓存,避免内存暴涨和速度下降。该模型能在32K上下文预算下一次性转录40+页文档,且编辑距离极低。在6K输出token场景下,推理速度比DeepSeek-OCR快35%,GPU内存和吞吐量保持恒定。AI模型Unlimited-OCRBaiduvLLMOCRR-SWA1 个信源在谈推荐理由:百度开源了Unlimited-OCR,在vLLM上跑,能一次性解析整本书,内存不涨,比DeepSeek-OCR快35%,做文档OCR的好东西。原文
00:54marktechpost@Sana Hassan精选本教程使用 Python 构建完整的 OCRmyPDF 流水线。先生成合成图像 PDF 以测试 OCR,再将其转换为可搜索 PDF 和 PDF/A 格式。通过提取侧边文本、计算单词召回率(word-recall)并比较文件大小来验证效果。还能调整 Tesseract 参数、清理噪点、纠正方向、在内存中运行 OCR 以及批量处理整个文件夹。技巧OCRmyPDFPDF/ATesseractPython文档扫描推荐理由:手把手教你用 Python 调 OCRmyPDF,从生成测试图片到批量转 PDF/A,还带召回率比较,适合文档处理需求的人。原文
00:42Geoffrey Hinton@geoffreyhintonGeoffrey Hinton 在 X 上推荐了 Adam Brown 关于 AI 对未来物理学影响的讲座。该讲座在 YouTube 发布,已获 1880 次观看。Hinton 的推文获得 4 次转发和 12 次点赞。行业Geoffrey HintonAdam BrownAI物理学术讲座推荐理由:Hinton 都说好的讲座!Adam Brown 聊 AI 如何改变物理学,快去YouTube看看。原文
00:36Yangyi@YangyixxxxNous Research 的 Hermes Agent 发布 MoA(Mixture-of-Agents)预置虚拟模型,允许在不同时刻为同一 Agent 路由不同模型,类似快慢脑逻辑。在新基准测试中,该方案比 Opus 4.8 高出 8%,比 GPT 5.5 高出 11%。多 Agent 场景下效果更显著,延续了 Hermes 的工程化优势。AI模型HermesNous Research智能体推理模型MoA推荐理由:Nous Research 让 Agent 在不同时刻自动切换不同模型,比单一模型更强,新基准上比 Opus 4.8 高8%、比 GPT 5.5 高11%。原文
00:21berryxia@berryxia精选73°DeepSeek开源了DSpark投机解码框架,用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题,并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中,单用户生成速度比MTP-1基线快60-85%,不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。AI模型DeepSeekDSparkDeepSeek-V4投机解码推理优化推荐理由:DeepSeek开源了DSpark框架,能让你的V4模型推理提速60%以上,且不影响质量。它解决了投机解码在真实部署中的难题,已经稳定跑在生产环境。原文
00:16量子位@听雨Yuxinlu1在Hugging Face模型排行榜上击败多家大厂模型,登顶多个细分榜单。该账号发布的模型综合得分领先于Meta、Google等公司的开源项目。排行榜显示其推理效率与准确率均达到SOTA水平。AI模型yuxinlu1Hugging Face模型排行榜开源模型推荐理由:一个个人开发者干翻大厂,看看yuxinlu1到底做了什么模型这么强原文
00:15AI Engineer@aiDotEngineer全球最大AI行业博览会2026 World's Fair门票已全部售罄,包括CTO/VP AI领导力track、研讨会及所有晚鸟票。主办方开放有限溢入场券,不保证座位,先到先得。旧金山各处仍有65场免费活动可参加。目前参会者已超6000人,预计达到7000人上限。行业World's FairAI展会旧金山售票推荐理由:全球最大AI博览会票卖光了,但还有65场免费活动可以蹭。想感受最前沿的AI氛围?趁溢入场券还没抢完赶紧行动。原文
00:15techcrunch@Kirsten Korosec特斯拉FSD系统是本期的核心话题。该新闻专栏聚焦特斯拉全自动驾驶的最新情况。行业TeslaFSD自动驾驶推荐理由:如果你关注自动驾驶,这篇专栏讲了特斯拉FSD近期最值得关注的点。原文
00:01Clement Delangue@ClementDelangueBrian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。原文
00:01Clement Delangue@ClementDelangue精选Hugging Face CEO Clement Delangue认为,当前最危险的AI系统是闭源前沿API模型(如通过编程助手分发的LLM),它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级:易于分析、能力较弱、传播更可控,且保护者与攻击者平等获取。监管前沿API只需针对少数巨头,成本低且容易执行;监管开源则会伤害小企业、研究者、大学等群体,并降低透明度。行业Hugging Face开源模型AI监管前沿模型推荐理由:Hugging Face CEO直言政府该管闭源API而不是开源模型,点出了监管争论中被忽略的黑箱风险。原文
23:45Aadit Sheth@aaditshElon Musk 宣布 Grok 4.5 基于 1.5T 参数的 V9 基础模型,并加入 Cursor 代码数据进行补充训练,已在 SpaceX 和 Tesla 内部私有 beta 测试。早期评估显示其性能接近甚至可能超过 Opus 模型,RL 持续优化模型。SpaceX 计划今年每月发布一个完全从零训练的新模型。目前 Cursor 拥有 700 万日活开发者,多数因使用 Claude 开始使用 Cursor。AI模型Grok 4.5CursorSpaceXOpus代码生成10 个信源在谈推荐理由:Grok 4.5 用 Cursor 数据训练,性能直逼 Opus,而且 SpaceX 要每月发新模型,代码圈和 AI 圈都该看看。原文
23:15Viking@vikingmuteTinyShip 更新了 tinyship-cloudflare skill,允许 agent 自动配置 Cloudflare 的 worker、Hyperdrive/D1、CF email、R2、Turnstile 等服务,并询问用户选择 Hyperdrive 还是 D1、是否清理 monorepo 等。该 SaaS 模板同时支持 Next.js 和 Nuxt.js 双框架,是国内首个 Nuxt 模板。定价为 299 元人民币,早鸟价 199 元。AI产品TinyShipCloudflareSaaS模板独立开发推荐理由:独立开发者 Viking 发了 TinyShip 的 Cloudflare skill,让 agent 帮你一键搭通 Cloudflare 全套服务,而且还支持国内微信支付和国外 Stripe,定价 199 元起,谁都能买。原文
23:15IT之家(博客/媒体)彭博社马克·古尔曼爆料,苹果今年将发布搭载 M5 Ultra 芯片的 Mac Studio,并计划在2028年推出 M7 Ultra 版本。苹果调整 M6 系列芯片规划,仅保留 M6 标准版,跳过 M6 Pro 和 M6 Max,重点研发 M7 系列。新款 Mac Studio 将配备更佳散热器以应对端侧 AI 工作负载,但外观不变。目前最新款搭载 M4 Max 和 M3 Ultra,最高可选 512GB 统一内存和 16TB 固态硬盘。AI产品Mac StudioM5 UltraM7 Ultra苹果台式机推荐理由:苹果 Mac Studio 要更新了!今年上 M5 Ultra,散热加强专为 AI 优化,2028 年还有 M7 Ultra,性能党可以关注。原文
23:15techcrunch@Kirsten Korosec华尔街分析师认为美光科技可能成为下一个英伟达,因其在AI内存芯片领域的核心地位。美光的高带宽内存(HBM)产品直接受益于AI训练和推理需求,2026年HBM收入预计增长超过200%。与英伟达GPU的深度绑定使美光在AI供应链中占据关键位置。多家投行上调美光目标价,预期其市盈率将向英伟达看齐。行业MicronNvidia内存芯片AI硬件华尔街6 个信源在谈推荐理由:华尔街现在盯上美光了,说它可能像英伟达一样暴涨。因为AI内存需求爆发,美光的HBM芯片供不应求,跟着英伟达GPU一起卖。想提前布局的话可以看看。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松7 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
22:18Geek@geekbb精选开源项目Second Brain是一个内存层,部署在Cloudflare Workers上。它通过MCP协议让Claude、ChatGPT、Cursor和Codex共享记忆。数据存储在用户自己的Cloudflare D1、Vectorize、KV和Workers AI中,采用语义检索。个人规模下,使用Cloudflare免费额度即可运行。AI产品ClaudeChatGPTCursorCodexMCP/工具7 个信源在谈推荐理由:Claude、ChatGPT这些AI能共用记忆了,数据归你管,还免费。试试?原文
21:45shao__meng@shao__meng精选LoanLens基于LandingAI构建,从6类借款人文档中结构化抽取字段,进行姓名一致性TF-IDF比对(相似度低于0.95告警)和护照篡改检测(比对核心组件位置与参考几何)。评分模型透明可解释:信用权重23%、DTI 23%、收入时效20%等,总分≥60批准,40-59复核,<40拒绝。系统附带仅限当前案件的RAG问答,支持字段溯源与人工检查。AI产品LandingAILoanLens欺诈检测RAG文档理解推荐理由:这套LoanLens系统把审贷初筛自动化,用结构化字段和可解释评分替代黑盒OCR,欺诈检测能抓文档篡改,审核员能直接查每个字段的证据。原文
21:39小互@imxiaohu71°马斯克透露Grok 4.5基于1.5T参数的V9基础模型,并在补充训练中加入了Cursor数据。该模型已在SpaceX和Tesla进入早期测试阶段。初步评估显示其性能接近甚至可能超过Anthropic的Opus模型。马斯克还表示强化学习持续提升模型性能,今年将每月发布完全从头训练的新模型。AI模型Grok 4.5马斯克XAI1.5T V9推理模型10 个信源在谈推荐理由:马斯克刚发了Grok 4.5,基于1.5T参数的V9模型,还加了Cursor数据,测试阶段就快超过Opus了,值得关注。原文
21:21IT之家(博客/媒体)奥地利数字化国务秘书亚历山大·普罗尔致信欧盟委员会,敦促将Anthropic作为战略重点引入欧盟。此举旨在反制美国阻止外籍人士使用Anthropic最先进AI模型的措施。普罗尔强调需提供法律确定性、市场准入、资本与价值观支持。欧盟委员会此前已就Anthropic停供顶尖模型表态,要求强化欧洲技术自主权。行业Anthropic欧盟AI监管技术自主权10 个信源在谈推荐理由:奥地利正拉着欧盟想办法把Anthropic拉过来建据点,对抗美国限制顶尖AI外流,欧洲技术自主博弈有新动作了。原文
20:54Decoder@Jonathan Kemper精选腾讯与多所中国大学联合发表的一篇综述论文指出,当前AI局限于生成答案,无法成为可靠的同事。研究者认为关键在于让AI在持久工作环境中完成整个任务,而非仅输出回答。论文强调结合持久工作空间与可复用技能,是实现从聊天机器人到“数字同事”转变的核心。该研究系统梳理了现有AI系统在任务完成方面的不足。论文Tencent智能体数字同事推荐理由:这篇论文点出了AI的下一个进化方向——从聊天变成真正干活。腾讯学者说要结合持久空间和可复用技能,才能让AI成为数字同事。原文
20:39berryxia@berryxiaAgent-Reach是一个开源CLI工具,允许AI Agent零API费用、本地运行地获取Twitter、Reddit、YouTube、GitHub、B站、小红书等平台内容。它通过智能选择稳定开源后端并自动健康检查和故障切换,避免手动编写爬虫。安装后Agent可执行“查看YouTube视频字幕”“搜索Twitter评价”等任务,将碎片化能力封装成skill并支持多后端路由与自动降级。该项目在GitHub上已收获3.5K Star,专注于补齐Agent低成本、可靠的内容获取短板。AI产品Agent-Reach开源项目多平台内容获取智能体CLI工具推荐理由:这个Agent-Reach项目开源免费,让AI Agent能直接搜Twitter、YouTube、B站等平台内容,不用写爬虫,自动切换稳定后端,适合做自媒体搜集信息的兄弟们。原文
20:24Decoder@Matthias Bastian精选Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型,缓存命中率从5%提升至60%。尽管token使用量持续增长,Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。行业CoinbaseGLM 5.2Kimi 2.7成本优化定价压力推荐理由:Coinbase用GLM 5.2和Kimi 2.7替换了西方模型,成本砍半,缓存命中率翻了12倍。想知道为什么中国模型更便宜?原文
19:16@elonmusk@elonmuskGrok 4.5 基于 xAI 的 1.5T V9 基础模型,并使用 Cursor 数据进行补充训练。该版本目前已在 SpaceX 和 Tesla 内部私测。早期评估显示其性能接近甚至超过 Opus。RL 训练仍在持续改进模型,Grok Build 工具每日提升。xAI 计划今年每月发布完全从头训练的新模型。AI模型Grok 4.5CursorSpaceX模型更新7 个信源在谈推荐理由:Musk 说 Grok 4.5 私测版已经接近 Opus,而且后面每月都会出新模型,想追动态可以瞅一眼。原文
19:12IT之家(博客/媒体)精选AI智能体安全厂商Manifold Security在调查OpenClaw官方插件市场ClawHub时发现,1508个技能中有557个采用冒用知名开发商名义的命名格式。其中23个插件直接冒名为“@OpenClaw/”或“@ClawHub/”,实际与官方无关。ClawHub于6月17日强化命名空间管理规则,6月19日移除这些误导性技能,并新增命名空间申诉机制。行业OpenClawClawHubManifold SecurityAI安全供应链安全3 个信源在谈推荐理由:OpenClaw市场23个伪装官方技能的插件被揪出来了,Manifold Security发现的命名空间抢注漏洞,ClawHub已经修复,小心供应链投毒。原文
19:09IT之家(博客/媒体)71°马斯克称 Grok 4.5 基于 1.5 万亿参数的 V9 基础大模型,并引入 Cursor 数据训练。该模型已在 SpaceX 和特斯拉内部测试,早期评测显示其性能接近甚至有望超越 Opus 模型。马斯克还透露 SpaceX 今年每月推出一批完全从零训练的新模型。Grok 4.5 的强化学习及调度框架仍在持续迭代。AI模型Grok 4.5SpaceX特斯拉Opus基础模型8 个信源在谈推荐理由:Grok 4.5 用了 1.5 万亿参数和 Cursor 数据,内部测试已接近 Opus,想了解马斯克最新大模型进展可以看这篇。原文
18:27Decoder@Maximilian Schreiner精选普林斯顿大学研究团队创建了CEO-Bench基准测试,要求AI代理在模拟环境中经营一家软件公司500天。测试结果显示,大多数参与模型最终破产,仅三个AI模型的资本高于初始资金。令人意外的是,一个简单的、不依赖AI的规则启发式方法几乎击败了所有AI模型。该测试揭示了当前AI在长期决策与资源管理方面的局限性。AI模型CEO-BenchPrinceton智能体基准测试AI代理推荐理由:普林斯顿大学用500天模拟测试AI经营公司,结果大部分亏钱,一个非AI规则反而更稳。看看哪三个模型赚钱了。原文
18:15Decoder@Matthias Bastian360创始人周鸿祎发布两款AI安全工具,旨在与Anthropic的Mythos竞争。其中一款工具已标记3,432个漏洞。周鸿祎承认中国模型在性能上落后西方20%至30%。他将Mythos比作“网络核武器”,并呼吁中国建立自己的战略威慑能力。AI产品360MythosAnthropic周鸿祎AI安全10 个信源在谈推荐理由:360推出了对抗Anthropic Mythos的AI安全工具,其中一个已经发现了3400多个漏洞,但周鸿祎实话实说咱们的模型比西方差两成。原文
16:38pandaily@contact@pandaily.com (Pandaily)随着AI数据中心建设加速,800G和1.6T光模块需求激增,带动光学模块MCU芯片成为半导体关键细分领域。国内厂商兆易创新(GigaDevice)和国民技术(Nations Technologies)正竞相抢占市场份额。该市场预计到2026年6月将实现显著增长。行业光模块MCUAI数据中心GigaDeviceNations Technologies推荐理由:AI数据中心让光模块MCU火起来了,兆易创新和国民技术正在抢这块蛋糕,看看谁更猛。原文
16:36Pandaily@contact@pandaily.com (Pandaily)76°北京大学与DeepSeek联合开源了投机解码框架DSpark,该框架无需修改模型即可将LLM推理速度提升60-85%。在严格延迟约束下,吞吐量增益最高达661%。DSpark通过高效的投机解码策略显著降低推理延迟。这一成果已在GitHub上开源。AI模型Peking UniversityDeepSeekDSparkLLM推理优化推荐理由:北大和DeepSeek搞的DSpark,不用改模型就能让推理快80%,吞吐量翻好几倍,适合做部署的试试。原文
16:18IT之家(博客/媒体)法拉第未来在芝加哥Automate展会发布工业级轮臂机器人Faber,分Faber U/T/S三个子系列,其中Faber U搭载Thor高算力芯片与双激光雷达。同步推出全新Futurist人形机器人标准版,定价89900美元,身高约173cm、重55kg,全身31个自由度,膝关节峰值扭矩320N·m,续航6小时(上代3倍)。Futurist Ultra版年内发布,搭载Jetson Thor芯片,支持自主充电。Faber T已用于电力巡检,Faber S配备具身智能数据采集工具链。AI产品法拉第未来FaberFuturist人形机器人工业机器人推荐理由:法拉第未来一下端出两个机器人系列:Faber轮臂机器人有U/T/S三种,能做工业物流和巡检;Futurist人形机器人8.99万美元起,续航6小时,步态更类人,适合商用部署。原文
16:18Geek@geekbb精选网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体,使用低成本 Flash 模型处理大部分上下文,仅在设计(Qwen)和编码(Kimi Code)等关键环节调用高性能模型。每日成本控制在 4~7 美元,并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。技巧Gentle-AIQwenKimi Code智能体模型路由推荐理由:挺实用的配置:11个智能体分工,Flash模型省成本,Qwen和Kimi Code干重活,每天才4-7美元,还降幻觉。原文
16:03Decoder@Jonathan Kemper精选新浪微博发布开源模型VibeThinker-3B,仅30亿参数。在数学和编程基准上,它匹配了DeepSeek V3.2和Kimi K2.5,后两者参数规模大333倍。模型通过多阶段后训练实现高性能。研究人员假设:逻辑推理可压缩进小模型,但广泛世界知识不行。AI模型VibeThinker-3B新浪推理模型开源模型推荐理由:30亿参数的小模型推理能力居然能打千亿级大模型,新浪VibeThinker-3B在数学和编程上很强,而且开源了。原文
15:45Jerry Liu@jerryjliu0Jerry Liu(LlamaIndex创始人)在推特上讨论AI Agent与SaaS的关系。他认为Agent像人类一样有核心通信接口,如chat、voice、slack。SaaS软件则需要根据具体用途定制接口,例如ticket tracking、CRM。目前SaaS公司都在构建Agent以捕捉工作自动化价值,但两者接口会随时间解绑。行业Jerry LiuLlamaIndexAI AgentSaaS智能体3 个信源在谈推荐理由:Jerry Liu说Agent和SaaS会分家,不是SaaS死了而是接口不同。看看他的观点。原文
15:45Geek@geekbbHermes MoA 是一种混合智能体(Mixture of Agents)模式,当前仅 Hermes CLI 支持使用,Hermes Studio 尚未集成。该模式允许用户添加多个辅助模型协同回答,但每增加一个辅助模型就会额外消耗大量 token。体验者称短期玩玩尚可,长期使用即使白嫖也难以承受 token 消耗。AI模型HermesMoACLI混合智能体token消耗推荐理由:你想试试多模型协作吗?Hermes 出了个 MoA 模式,CLI 已经能用了,加几个辅助模型就多费多少 token,白嫖党慎入。原文
15:15marktechpost@Sana Hassan精选本教程基于 Hugging Face 的 Fable 5 Traces 数据集,在 Colab 中构建稳定工作流。手动解析合并的 JSONL 文件避免依赖问题,检查仓库文件并标准化工具调用。通过审计结构、脱敏密钥和可视化分布,导出安全的无 CoT 聊天数据集。最后使用纯 Python 的朴素贝叶斯模型在 traces 上训练基线,无需复杂框架。技巧Fable 5 TracesColab工具调用数据审计基线模型推荐理由:手把手教你用 Colab 搞定 Fable 5 Traces 数据,从解析到审计再到训练基线,全流程避坑实战。原文