全部 AI 动态 · AI 热点

5月28日

18:10

18:10

marktechpost@Sana Hassan

本教程在 Google Colab 中搭建完整的 pgvector 环境，演示如何将 PostgreSQL 用作强大的向量数据库。内容包括安装 PostgreSQL、编译 pgvector 扩展、通过 Psycopg 连接并注册向量类型以实现 Python 集成，以及使用 SentenceTransformers 生成嵌入并存储。教程覆盖了语义搜索、混合搜索、稀疏向量和量化向量四种搜索模式，为 AI 应用提供实用的向量搜索实现方案。

技巧 pgvector 向量搜索 PostgreSQL 教程嵌入

推荐理由：想用 PostgreSQL 做向量搜索的开发者可以直接跟着教程在 Colab 里跑通，省去环境配置的坑，四种搜索模式覆盖了从基础到高级的需求。

5月26日

04:26

04:26

marktechpost@Sana Hassan

精选

本教程使用NVIDIA FLARE构建联邦学习实验，在非IID CIFAR-10数据集上比较FedAvg和FedProx算法。客户端数据通过Dirichlet分布分割以模拟现实中的标签不平衡。利用NVFlare Job API定义和启动联邦任务。教程包含具体实现步骤和性能对比。

技巧 FedAvg FedProx NVIDIA FLARE 联邦学习 CIFAR-10

推荐理由：手把手教你用NVIDIA FLARE做FedAvg和FedProx对比实验

5月25日

12:45

12:45

marktechpost@Sana Hassan

精选

本文是一篇教程，指导读者使用 Langfuse（一个开源 LLM 工程平台）构建完整的可观测性与评估管道。教程涵盖了追踪、提示管理、评分、数据集和实验等核心功能。它支持使用真实的 OpenAI 密钥或确定性模拟 LLM，让读者无需付费模型访问即可理解所有主要功能。文章提供了逐步实现的工作流程，适合希望系统学习 LLM 工程实践的开发者。

技巧 Langfuse 可观测性 LLM 工程提示管理评估管道

推荐理由：想系统掌握 LLM 应用的可观测性与评估？这篇教程用 Langfuse 手把手带你走通追踪、提示管理、评分和实验全流程，还支持模拟 LLM 免费用。做 LLM 工程或运维的团队值得收藏。

5月24日

18:22

18:22

Decoder@Matthias Bastian

数学家Adam Kucharski发现，当向Microsoft Copilot输入相同数据集但不同国家标签时，Copilot会编造不存在的国家差异，输出详细刻板印象而非准确结果。思考模型能识别这种把戏，但前提是用户知道何时使用它们。文章指出，在Copilot、Gemini等AI工具中保留默认模型选择可能导致错误结论，用户应主动选择适合任务的模型。

技巧大模型 AI安全 Copilot Gemini

推荐理由：别让AI默认模型坑了你

10:52

10:52

marktechpost@Sana Hassan

精选

本文介绍了如何基于 Anthropic API 构建 SuperClaude 框架的高级工作流，通过集成命令系统、多智能体协作、模式切换和会话记忆功能，实现更复杂、更可控的 AI 交互。该框架允许开发者定义自定义命令、创建专用智能体角色、切换不同工作模式，并利用会话记忆保持上下文连续性。教程提供了具体代码示例和架构设计思路，适合希望扩展 Claude 能力的开发者。

技巧 SuperClaude 框架工作流智能体会话记忆 Anthropic API

推荐理由：想用 Claude 做复杂自动化任务的开发者，这个框架能帮你把命令、智能体和记忆整合成一套可复用的工作流，比直接调 API 灵活得多，值得照着教程搭一套。

5月13日

21:36

21:36Simon Willison’s Weblog（博客/媒体）

Andrew Quinn 在文章脚注中反思了编程学习中的常见陷阱：总担心自己写的工具已被前人实现过。他认为，与其花时间漫无目的地学习，不如亲自重新发明几个轮子——在大多数领域四五个足矣，数学或计算机科学等严谨领域可能需要二十到三十个。每次重新发明和过程中提出的问题，能比同等时间的被动学习更快将你推向知识前沿。他以自己用有限状态转换器（FST）将 3GB SQLite 数据库压缩到 10MB 为例，说明这种实践的价值。

技巧编程学习实践方法论 SQLite 有限状态转换器职业发展

推荐理由：Andrew Quinn 戳中了每个自学编程者的焦虑——怕重复造轮子，结果连一个轮子都没造过。想真正理解技术边界的开发者，读完会重新审视自己的学习方式。

21:36

21:36Simon Willison’s Weblog（博客/媒体）

Simon Willison 分享了一个技巧：在脚本的 shebang 行中直接调用 LLM，让自然语言文本文件像可执行脚本一样运行。最简单的用法是 `#!/usr/bin/env -S llm -f`，后面跟自然语言指令即可生成内容（如 SVG）。还可以通过 `-T` 选项调用工具（如获取当前时间写俳句），甚至嵌入 YAML 模板定义 Python 函数作为工具，实现复杂计算。这个模式让 AI 模型无缝融入 Unix 脚本生态，开发者可以直接用自然语言编写可执行脚本。

技巧 LLM shebang 脚本技巧自然语言编程工具调用

推荐理由：这个技巧把 LLM 变成了 Unix 脚本的一等公民，做自动化或 CLI 工具的开发者可以直接用自然语言写可执行脚本，省去解析参数的麻烦。

00:33

00:33Google Developers Blog（博客/媒体）

Google博客分享将脆弱的销售研究原型重构为生产级AI智能体的经验，基于Agent Development Kit (ADK)。通过用编排子智能体替代单体脚本，并使用Pydantic结构化输出，消除了静默失败和脆弱解析问题。文章强调动态RAG管道和OpenTelemetry可观测性对确保AI智能体可扩展、低成本且透明至关重要。

技巧智能体 MCP/工具 Google ADK 可观测性 RAG

推荐理由：本文提供了实用的工程经验，尤其适合正在将AI原型投入生产的开发者，展示了结构化设计和监控的重要性。

00:33

00:33

GitHub Blog@Kedasha Kerr

GitHub博客发布了一篇为初学者设计的开源贡献入门指南，详细介绍了如何找到参与开源社区的机会。文章涵盖了从选择合适的项目到提交Pull Request的完整流程，包括如何利用标签（如“good first issue”）定位适合新手的任务。该指南旨在降低开源贡献的技术门槛，帮助新人快速融入开源生态。

技巧开源/仓库 GitHub 入门指南

推荐理由：这篇指南为开源新手提供了清晰的行动路径，有助于扩大开源社区的参与范围，对培养贡献者生态有实际价值。

5月11日

00:21

00:21OpenAI Blog（博客/媒体）

OpenAI发现，在强化学习算法参数中添加自适应噪声能显著提升性能。该方法实现简单且极少降低性能，适用于各类强化学习问题，为探索策略提供了高效新思路。

技巧 reinforcement-learning exploration parameter-noise openai

推荐理由：此方法实现简单且效果稳定，可即插即用于现有强化学习系统，大幅减少调参成本。