全部 AI 动态 · AI 热点

6月23日

02:04

AWS Machine Learning Blog@Guy Bachar

精选

Ampersend 在 Amazon Bedrock AgentCore Payments 之上构建了一个按智能付费的路由层，让 AI 代理自动将任务路由到最有效的模型并按请求付费。该方案支持在预算内运行，并实现了双跳支付模式端到端工作。文章还提供了如何开始实施的具体步骤。

推荐理由：想给 AI 代理按请求计费？看 Ampersend 怎么用 Bedrock AgentCore 做自动路由，还能控预算。

原文

00:50

AWS Machine Learning Blog@Nick Biso

精选

本文介绍了如何通过Amazon SageMaker AI处理作业部署ComfyUI工作流，实现单次批量生成数百张高质量图像。使用AWS CDK配置基础设施，利用GPU加速处理自动执行图像生成。该方案可适配自定义ComfyUI工作流，适用于规模化创意流水线。

技巧 ComfyUI Amazon SageMaker AI 图像生成工作流 AWS CDK

推荐理由：AWS官方教你用ComfyUI和SageMaker AI批量跑图，省时省GPU钱，适合需要自动生成大量图像的团队。

原文

6月22日

23:59

23:59IT之家（博客/媒体）

谷歌DeepMind杰出工程师、Gemini预训练负责人弗拉基米尔·费恩伯格在博客中表示，想进入OpenAI、Anthropic、DeepMind等前沿实验室，需要像狗一样拼命干。他认为顶尖大学中最优秀的本科生和博士生已在顶级会议发表机器学习研究、参加竞赛，并具备目标感、数学成熟度和毅力。他建议学生选择以数学证明为基础的困难课程，牺牲夜晚和周末，并从前沿实验室的业务边界寻找突破口，比如模型运行所需的外部环节。此外，他提醒要成为同事愿意看到你成功的人，找到能促进团队互补的项目。

技巧 DeepMind Gemini OpenAI Anthropic 求职建议

推荐理由：DeepMind大佬亲授求职内幕：进顶级AI实验室没有捷径，但可以从前沿实验室的周边业务切入，还有具体能力要求，很实用。

原文

07:15

marktechpost@Asif Razzaq

精选

该指南介绍了7种智能体记忆类型：工作记忆、语义记忆、情节记忆、程序记忆、检索记忆、参数记忆和前瞻记忆。每种记忆覆盖存储内容、存储位置和构建时机。包含对比表格和可运行的Python代码示例。

技巧智能体记忆系统 Python 工程指南

推荐理由：想给自己的智能体加上记忆？这篇把7种记忆类型讲得特别清楚，还给了Python代码，直接上手复制。

原文

6月21日

14:55

marktechpost@Sana Hassan

精选

本教程使用 Crawlee for Python 搭建完整的网页爬取工作流。通过 BeautifulSoupCrawler、ParselCrawler 和 PlaywrightCrawler 分别爬取静态与动态内容，提取标题、元数据和产品字段。教程还演示如何构建链接图，并将数据导出为 JSON、CSV 以及 RAG 就绪的 JSONL 分块文件。最后附带 robots 处理与截图功能，从设置到 AI 输出一步到位。

技巧 Crawlee Python BeautifulSoup Parsel Playwright 爬虫 RAG

推荐理由：想用 Python 从零搭一套能把网页内容直接喂给 RAG 的爬虫管道吗？这篇保姆级教程教你用 Crawlee 搞定 robots、截图和分块导出。

原文

6月20日

17:12

marktechpost@Sana Hassan

精选

本文使用TimeCopilot在航空乘客数据集和含异常注入的合成季节性序列上构建端到端预测工作流。评估了统计模型、基础模型和可选的GPU模型，采用滚动交叉验证和多种误差指标。生成了带预测区间的概率预测，可视化未来趋势并标记异常观测。还探索了TimeCopilot的可选LLM智能体，该智能体能选择模型并解释其预测。

技巧 TimeCopilot 基础模型异常检测预测管道时间序列

推荐理由：这篇教程手把手教你用TimeCopilot做时间序列预测，能自动检测异常，还能用LLM帮你选模型并解释结果。

原文

01:45

GitHub Blog@Natalie Guevara

GitHub内部开发了名为Qubot的Copilot驱动数据分析智能体，允许员工用自然语言查询公司数据。团队分享了在构建过程中解决的关键技术挑战，包括如何将自然语言转化为SQL查询、处理复杂数据模型以及确保查询准确性。该智能体已部署在GitHub内部，支持超10个数据源。

技巧 Qubot GitHub Copilot 数据查询自然语言转SQL

推荐理由：GitHub分享了他们用Copilot搭建内部数据分析工具Qubot的实战经验，从自然语言到SQL的难点和解决思路都有，适合想搞企业内部查询智能体的团队参考。

原文

6月19日

22:15

AWS Machine Learning Blog@Ebbey Thomas

精选

本文演示如何通过Model Context Protocol (MCP)在Amazon Quick中启用Adobe Marketing Agent。配置集成后，使用Adobe凭证进行身份验证即可获取最新洞察。示例工作流可返回受众排名、忠诚度细分摘要、旅程使用情况和冲突建议。

技巧 Adobe Marketing Agent Amazon Quick MCP/工具营销自动化工作流

推荐理由：AWS博客教你一步步把Adobe Marketing Agent接进Amazon Quick，用MCP协议直接拿受众排名和忠诚度数据，营销人员省事多了。

原文

15:12

掘金本周最热@倔强的石头_

Kingbase磁盘满时跑DELETE不会释放空间，原因是MVCC机制和未归档WAL。本文从OS物理层（df -Th、du -sh）到DB逻辑层（sys_database_size函数）逐步排查，用SQL扫描出test_bloat表占用558MB纯数据。还解释了TOAST机制和索引数据比过高（如纯数据1GB但索引5GB）的性能陷阱。最后给出企业级归档配置和表空间迁移等优化方案。

技巧 Kingbase 金仓数据库数据库运维磁盘空间调优

推荐理由：搞数据库的，磁盘满了别只敲DELETE！这篇Kingbase实战教程教你怎么从OS到内核一步步精准排查和瘦身。

原文

11:28

marktechpost@Sana Hassan

本文使用Hugging Face加载的Salesforce CodeGen实现端到端工作流。除基础推理外，添加函数提取、语法检查、静态安全检查和单元测试验证。对最佳N个候选项进行重排序，组合多轮程序合成并实验不同提示风格。最后可视化迷你基准测试并将生成的工件导出为可复用文件。

技巧 Salesforce CodeGen Hugging Face Python 代码生成单元测试

推荐理由：手把手教你用Salesforce CodeGen写Python函数，还能自动验证和重排序，适合想提升代码生成质量的开发者。

原文

07:41

AWS Machine Learning Blog@Apoorva Chandra

精选

Amazon SageMaker AI 提供全托管实时推理，支持单模型端点（SME）和推理组件（IC）两种架构。通过 CloudWatch 详细指标和 Insights 仪表盘，用户可监控生成式 AI 推理的延迟、吞吐量等关键指标。该仪表盘支持自定义视图和异常检测，帮助快速定位性能瓶颈。SME 和 IC 端点均能集成此观测能力，适用于生产环境的调试与优化。

技巧 SageMaker CloudWatch 生成式 AI 推理监控与调试

推荐理由：AWS 教你用 CloudWatch 盯着 SageMaker 上的生成式 AI 推理，有详细指标和仪表盘，调性能抓问题都好使。

原文

02:52

Cloudflare Blog@Grant Bourzikas

精选

Cloudflare博客详解其多阶段漏洞发现工具的技术架构，包括状态控制机制、通过对抗性审查将误报率降低90%的方法，以及如何绕过LLM上下文长度限制（如4k token限制）。该工具实现自动化分类，每日可处理超过10万条告警。文章还公开了其基于GPT-4的分阶段提示词模板和缓存策略。

技巧 Cloudflare 漏洞检测自动化 LLM

推荐理由：Cloudflare公开了他们内部用的漏洞检测工具怎么做，从状态管理到对抗审查都讲了，想自己搭自动化安全工具的可以抄作业。

原文

6月18日

09:39

marktechpost@Sana Hassan

精选

本教程演示如何使用 NVIDIA SkillSpector 对 AI 技能进行安全风险预部署扫描。通过构建良性和故意含漏洞的技能语料库，利用 SkillSpector 的 LangGraph 工作流进行扫描，并用 pandas 整理风险评分与发现。结果导出为 SARIF 格式，支持自定义分析器和可选的 LLM 语义分析。该流程覆盖静态分析、风险分类可视化及报告生成。

技巧 NVIDIA SkillSpector SARIF AI安全静态分析

推荐理由：NVIDIA 教你用 SkillSpector 做 AI 技能安全扫描，从写语料到出 SARIF 报告，一步一步都有代码，适合想加固 AI 应用的开发者。

原文

6月17日

08:59

08:59SuperTechFans（博客/媒体）

精选76°

作者在 2022 年 M2 Mac（64GB RAM）上测试 Mistral 7B、Gemma 3、OpenAI OSS-20B、Qwen 3 MOE 等多种模型，使用 llama.cpp、Ollama、LM Studio 等工具。她发现自从 GPT-OSS 发布后，本地模型在编程任务上已足够好用，尤其 Google 的 Gemma 4 系列（如 gemma-4-26b-a4b 和 gemma-4-12b-qat）在 Python 代码重构、类型提示修复、写单元测试等 agentic 任务中准确率和速度约为前沿模型的 75%。她分享了本地 agentic 设置：用 Pi 作 agent 框架、LM Studio 作推理服务器，所有操作放在 Docker 容器中以限制权限。本地模型仍有推理速度慢、上下文窗口受硬件限制等问题，但隐私友好、可自由调整参数。

技巧 M2 Mac Gemma 4 Pi LM Studio 本地模型

推荐理由：想试本地模型？这篇有 M2 Mac 上跑 Gemma 4 的详细配置，还有 Pi+LM Studio 的 agentic 设置，比云端省心。

原文

08:07

marktechpost@Sana Hassan

精选71°

本文通过xFormers实现GPU上内存高效的Transformer模型。对比标准注意力实现，验证了内存高效注意力在不同序列长度下的速度和内存表现。教程涵盖因果掩码、打包变长序列（packed sequences）、分组查询注意力（GQA）以及自定义ALiBi偏置。最后将上述技术结合SwiGLU层和自动混合精度训练，构建了一个可训练的GPT风格模型。

技巧 xFormers Packed sequences GQA ALiBi SwiGLU 内存优化

推荐理由：手把手教你用xFormers做内存优化，打包序列、GQA、ALiBi、SwiGLU全都有，比标准实现省显存还快。

原文

06:55

AWS Machine Learning Blog@Sandeep Singh

精选

Amazon Bedrock Guardrails 推出了 InvokeGuardrailChecks API，允许在代理式AI应用的任意阶段独立应用安全检查，无需预先创建护栏资源。该API支持内容过滤、敏感词检测等安全策略。开发者可以将其集成到多轮对话流程中，动态检查用户输入和模型输出，保障应用安全。文章提供了Python代码示例，演示如何调用此API实现安全守护。

技巧 Amazon Bedrock Guardrails InvokeGuardrailChecks 智能体 AI安全

推荐理由：AWS 出了个新 API，能在智能体对话流程里随时加安全检查，不用提前配规则，挺实用。

原文

01:55

AWS Machine Learning Blog@Andy Peng

精选

本文介绍如何利用Amazon SageMaker AI中的P-EAGLE方法并行化推测解码，加速生成式AI推理。用户可从SageMaker JumpStart目录中选择兼容模型，并配置并行草稿生成参数。通过部署优化的实时SageMaker AI端点，可显著降低推理延迟。P-EAGLE基于EAGLE框架，支持多头并行推测，适用于Llama等主流模型。

技巧 P-EAGLE Amazon SageMaker AI SageMaker JumpStart 推测解码推理加速

推荐理由：AWS教你用P-EAGLE在SageMaker上把推理加速好几倍，选模型调参数就能部署，简单实用。

原文

00:25

00:25Simon Willison’s Weblog（博客/媒体）

Georgi Gerganov 在 Hacker News 评论中分享，过去一个半月他几乎每天都用 Qwen3.6-27B 模型处理编码任务，运行在 M2 Ultra 或 RTX 5090 上。他使用轻量级 pi agent（pi -nc --offline）搭配简短系统提示来适配个人编程风格。虽然主要用于 ggml-org 的琐碎维护任务，但认为该模型是高效的辅助工具。

技巧 Qwen3.6-27B Georgi Gerganov pi 本地模型编程助手

推荐理由：Georgi Gerganov 亲测 Qwen3.6-27B 配合 pi agent，日常编程完全够用，本地运行无压力。

原文

6月16日

23:31

23:31IT之家（博客/媒体）

71°

开发者@0x0SojalSec 绕过苹果M4神经网络引擎的软件限制，通过逆向工程使用自定义MIL（模型中间语言）直接与芯片通信，没有调用Core ML、Metal或GPU。训练数据全程放在RAM中运行，不写入NAND闪存，速度更快。解锁后M4在iPad或Mac上可达到15.8TFLOPS的AI处理性能，用于训练模型。目前自定义MIL能否用于更新的Apple Silicon尚不明确。

技巧 M4 Apple Silicon 神经网络引擎模型训练逆向工程

推荐理由：有个开发者自己写了一套代码，把M4芯片的AI训练能力全开出来了，不用苹果官方工具，跑到了15.8TFLOPS。想用iPad或Mac训练模型的人可以看看。

原文

15:29

marktechpost@Sana Hassan

精选

本教程基于Docling Parse工具，演示了如何从PDF文档中提取布局感知的结构化数据。首先设置Python环境并解决Colab依赖问题，生成包含文本、列、表格、矢量和嵌入图片的多页PDF。然后提取单词、字符、行及其页面坐标，渲染可视化覆盖层。最终将结果保存为JSON和CSV格式，支持阅读顺序重建和检索准备。

技巧 Docling Parse PDF解析布局感知结构化提取文档智能

推荐理由：手把手教你用Docling Parse从PDF里提取布局信息，生成带坐标的结构化数据，适合做文档智能和RAG。

原文

09:28

GitHub Blog@Natalie Guevara

GitHub 官方博客发布了一篇面向初学者的教程，介绍如何使用 GitHub Copilot CLI 的斜杠命令（如 `/explain`、`/fix`、`/tests`）在终端中控制 AI 代理。教程演示了如何通过自然语言让 Copilot 解释代码、自动修复错误、生成测试用例等。文章列出了 6 个核心斜杠命令及其用法，帮助开发者无需离开终端即可完成常见开发任务。

技巧 GitHub Copilot CLI 斜杠命令终端教程编程助手

推荐理由：GitHub 官方出了个新手教程，教你用 Copilot CLI 的斜杠命令直接在终端修 bug、写测试，省得来回切窗口。

原文

02:13

AWS Machine Learning Blog@Po-Shin Chen

精选

AWS博客介绍了Strands Evals工具，用于检测AI Agent执行中的失败并定位根因。调用detector函数后，输出包含分类失败类型与置信度分数、从根因到下游症状的因果链，以及修复建议（指定修改系统提示还是工具定义）。该工具可集成到评估流程中，实现每个测试运行的自动诊断。

技巧 Strands Evals AWS 智能体故障诊断评测

推荐理由：AWS教你用Strands Evals自动揪出AI Agent的失败根因，还告诉你该改提示词还是工具定义，比盲猜管用多了。

原文

6月15日

22:05

AWS Machine Learning Blog@Sundar Raghavan

精选

本教程介绍如何使用 Deep Agents 和 Bedrock AgentCore 构建竞争研究智能体。你将在多步AI工作流中创建隔离执行环境。在第二部分，你可以通过 AgentCore CLI 将同一智能体部署到 Bedrock AgentCore Runtime，作为托管、会话隔离的服务运行。

技巧 Deep Agents Bedrock AgentCore AgentCore CLI 智能体

推荐理由：AWS 教你用 Deep Agents 和 Bedrock AgentCore 搭研究智能体，还能用 CLI 部署成托管服务，适合搞多步AI流程的开发者。

原文

11:13

marktechpost@Michal Sutter

精选

Claude Code 2026 指南介绍了 25 项功能，包括 CLAUDE.md、skills、subagents、hooks、MCP 和 Auto Mode。它提供了对比表格和可运行的代码示例。还包含实际用例和一个交互式演示供读者尝试。该指南覆盖了从基础配置到高级自动化的完整工作流。

技巧 Claude Code 编程助手 MCP/工具智能体

推荐理由：学会Claude Code全部25招

原文

10:04

marktechpost@Sana Hassan

精选

本教程演示如何使用FineWeb数据集进行流式采样（无需下载TB级全量数据），检查模式与元数据（如URL、语言、语言得分、token数量）。复现了FineWeb质量过滤管道的简化版本。涉及去重与分词操作。适合大规模网络语料分析的学习。

技巧 FineWeb 流式处理过滤去重分词

推荐理由：手把手教你用FineWeb做数据清洗

原文

6月14日

08:51

08:51Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 探索如何将任意 SQL 查询结果列映射回其源表.column。他尝试了三种方法：使用 apsw 库、通过 ctypes 调用 SQLite 的 sqlite3_column_table_name() C 函数（Python 未直接暴露），以及解析 EXPLAIN 输出。Claude Code (Opus 4.8) 帮助找到了这些方案。该功能旨在增强 Datasette 的 SQL 查询结果展示。

技巧 python sqlite Datasette SQL查询 Claude Code

推荐理由：教你三种方法追溯SQL列来源

原文

01:51

marktechpost@Sana Hassan

精选

本教程演示如何使用QwenPaw搭建智能体工作区。首先安装并初始化QwenPaw，配置工作目录和认证。通过Colab secrets连接可选模型提供商（如OpenAI、Anthropic）。创建包含自定义技能和本地知识文件的结构化工作区。最后启动控制台并测试流式API。

技巧 QwenPaw 智能体流式API Colab 自定义技能

推荐理由：手把手教你搭QwenPaw智能体工作区

原文

6月13日

15:09

15:09IT之家（博客/媒体）

精选

微软本周三在 GitHub 开源了面向 iOS 的 SwiftStreamingMarkdown 渲染库，专为大语言模型聊天界面优化流式 Markdown 渲染性能。该库采用 MIT 许可证，通过 Swift Package Manager 集成，增加约 3 MB 下载体积。与传统方案不同，它能在 AI 逐段生成文本时同步解析渲染，避免主线程过载，在 iPhone XS 测试中高负载场景下未出现明显 UI 卡顿。支持 CommonMark 与 GFM 核心子集，包括标题、代码块、表格、LaTeX 公式等 15 种语法，并提供可配置主题与生命周期监听。

技巧 SwiftStreamingMarkdown 微软 iOS 流式渲染开源库

推荐理由：微软开源，专治 AI 聊天流式渲染卡顿

原文

11:21

marktechpost@Sana Hassan

精选

本文介绍了一个端到端的空间图学习流程，使用city2graph从OpenStreetMap收集城市POI和街道网络数据，并构建合成回退数据以增强可靠性。通过工程化空间特征，构建多种邻近图族并比较其表示效果。将异构和同构图转换为PyTorch Geometric格式，训练GraphSAGE模型从空间结构预测POI类别。

技巧 city2graph OSMnx PyTorch Geometric GraphSAGE 图神经网络

推荐理由：手把手教你用图神经网络分析城市数据

原文

11:12

11:12Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 更新了其 OpenAI WebRTC 音频会话工具，新增对 GPT-Realtime-2 模型的支持，该模型具备 GPT-5 级推理能力，知识截止日期为 2024 年 9 月 30 日。用户现在可以在浏览器中粘贴文档上下文，与模型进行基于文档内容的音频对话。该工具最初于 2024 年 12 月发布，用于测试 OpenAI 的 WebRTC 实时音频 API。

技巧 OpenAI WebRTC GPT-Realtime-2 音频对话文档上下文

推荐理由：用 GPT-Realtime-2 模型边聊边读文档

原文

6月12日

15:48

15:48Latent Space (swyx)（博客/媒体）

在 AI 领域相对平静的一天，Loopcraft 概念被 Peter Steinberger、Boris Cherny 和 Andrej Karpathy 等人提出并强调。Loopcraft 指的是通过巧妙堆叠循环（如循环调用、迭代优化）来提升 AI 系统性能或解决复杂问题的方法。这一概念揭示了在 AI 编程和模型推理中，简单的循环结构可以带来显著的效率提升和结果改进。对于关注 AI 编程技巧和模型优化的开发者来说，这是一个值得深入理解的新思路。

技巧 Loopcraft 循环优化 AI编程技巧模型推理 Peter Steinberger

推荐理由：Loopcraft 揭示了 AI 编程中一个被低估的优化技巧——堆叠循环能显著提升模型推理和代码生成质量，做 AI 应用开发的团队值得深入研究。

原文

03:40

AWS Machine Learning Blog@Tim Shear

精选

AWS博客展示了一个智能文档处理管道，结合了Amazon Bedrock的按需推理和批量推理两种选项。该管道允许用户根据文档处理时间和成本灵活选择推理模式。按需推理适用于实时处理请求，而批量推理则适合大规模文档处理。这种设计让用户能够动态调整管道以适应不同场景需求。

技巧 Amazon Bedrock 按需推理批量推理文档处理

推荐理由：AWS教你灵活管理文档处理成本与时间

原文

6月11日

00:00

GitHub Blog@Natalie Guevara

GitHub Copilot CLI通过集成LSP服务器实现代码智能，取代了原先的暴力grep和反编译方式。用户需要安装并配置对应的语言服务器，例如Python的pyright或JavaScript的typescript-language-server。配置完成后，Copilot CLI能够理解代码结构，生成更精准的命令建议。这种方案提升了开发者的交互效率。

技巧 GitHub Copilot CLI 语言服务器编程助手工具配置

推荐理由：让Copilot CLI更懂代码

原文

6月10日

06:19

06:19Simon Willison’s Weblog（博客/媒体）

Wes McKinney 开发的 AgentsView 是一款用于探索本地编程代理 token 使用情况的工具。Claude Fable 5 发布后，其定价尚未被 AgentsView 的数据库收录。作者利用 Fable 逆向工程了 AgentsView，并找到了设置自定义价格的方法。该方法允许用户手动添加新模型的定价信息，以便在 AgentsView 中准确追踪 token 消耗和费用。

技巧 AgentsView token 使用追踪自定义定价 Claude Fable 5 逆向工程

推荐理由：对于使用 AgentsView 追踪 AI 编程代理 token 消耗的开发者，这个技巧能让你第一时间为新模型设置自定义价格，避免数据缺失。建议收藏备用。

原文

6月9日

16:45

marktechpost@Sana Hassan

本教程介绍了 NVIDIA cuTile Python，一个基于分块的 GPU 编程接口，允许在 Python 中编写类 CUDA 的内核。教程在 Google Colab 环境中逐步实现向量加法、矩阵加法和矩阵乘法的分块内核，并包含 PyTorch 回退以确保可执行性。每个阶段都通过 PyTorch 验证正确性并基准测试中位运行时间。该教程适合希望学习 GPU 编程但不想深入 CUDA C++ 的 Python 开发者。

技巧 GPU 编程 NVIDIA cuTile Python 教程 Colab 分块内核

推荐理由：想学 GPU 编程但被 CUDA C++ 劝退的 Python 开发者，这个教程让你直接在 Colab 里跑分块内核，还能对比 PyTorch 验证结果，值得动手试试。

原文

6月3日

14:44

14:44IT之家（博客/媒体）

Puget Systems 发布了针对内容创作场景的内存容量性能测试报告，对比 16GB、32GB 和 64GB 内存对 Lightroom Classic、Photoshop、After Effects、Premiere 和 DaVinci Resolve 等软件的影响。测试平台为 AMD Ryzen 9 9950X3D 和 RTX 5080。结论是 16GB 会严重拖慢 Lightroom Classic（性能低 45%）和 After Effects（低 43%），32GB 适合轻量创作，64GB 是多数专业创作者的甜点容量。Photoshop 和 Premiere 对内存相对不敏感，但复杂项目仍需更大内存。

技巧内存容量内容创作性能测试 Puget Systems 硬件选购

推荐理由：内容创作者和视频编辑者常纠结内存该买多大，Puget 的实测数据直接给出了答案——16GB 是瓶颈，32GB 够用但不够爽，64GB 才是专业级的甜点。建议正在配新机或升级的创作者点开看看，避免花冤枉钱。

原文

08:51

marktechpost@Sana Hassan

精选

本教程详细介绍了在Google Colab上使用QLoRA和DPO微调LFM2模型的完整步骤。步骤包括使用TRL库进行监督微调（SFT），然后应用DPO算法优化，最后合并适配器。教程提供了可运行的代码和详细解释，适合有基础的用户实践。所有操作在免费的Colab环境下完成。

技巧 LFM2 QLoRA DPO Google Colab TRL PEFT 微调

推荐理由：手把手教你微调LFM2，用Colab免费跑

原文

6月2日

10:59

marktechpost@Sana Hassan

精选

本文介绍了如何通过NVIDIA Apex库中的FusedAdam优化器和FusedLayerNorm层，结合PyTorch原生的torch.amp混合精度训练，来加速Transformer模型的训练。作者从源码编译Apex，检测融合内核是否可用，并进行了基准测试。实验表明，这些优化可以显著提升训练速度，同时保持模型精度。对于需要高效训练Transformer的开发者，这是一份实用的性能优化指南。

技巧 Transformer NVIDIA Apex 混合精度训练性能优化 PyTorch

推荐理由：Transformer训练慢是很多开发者的痛点，这篇教程直接给出了用Apex和torch.amp加速的具体步骤和基准测试结果，做NLP或大模型训练的团队可以照着优化自己的代码。

原文

5月31日

10:18

marktechpost@Sana Hassan

精选

SkillNet 是一个实用框架，用于发现、安装、检查、评估和组织可复用的AI技能。本教程展示了如何利用 SkillNet 构建技能增强型AI智能体，涵盖搜索、评估、图分析和任务规划等核心功能。该框架旨在解决AI技能碎片化问题，让开发者能更高效地组合和复用技能模块。通过 SkillNet，开发者可以快速集成预构建技能，提升智能体的灵活性和可扩展性。

技巧智能体 SkillNet 技能复用框架任务规划

推荐理由：SkillNet 解决了AI技能复用和组合的痛点，做智能体开发的团队可以直接用它来快速集成搜索、图分析等能力，省去重复造轮子的时间。

原文

5月30日

08:48

marktechpost@Sana Hassan

精选72°

AgentTrove 是目前最大的开源智能体交互轨迹数据集，包含 170 万条 ShareGPT 格式的记录。本文提供了一份详细的 Python 教程，演示如何在不完全下载的情况下流式读取数据集、标准化智能体对话轮次、提取命令、分析轨迹，并最终将成功的交互轨迹导出为干净的 SFT 微调数据集。这对于需要高质量智能体训练数据的开发者来说非常实用。

技巧智能体数据集 SFT 微调 Python 教程开源/仓库

推荐理由：做智能体微调的团队终于有了大规模、可流式处理的开源轨迹数据，不用再自己爬取或合成。想快速上手构建 ShareGPT 格式 SFT 数据集的开发者，这篇教程可以直接照着跑。

原文