全部 AI 动态 · AI 热点

6月23日

10:38

10:38

arXiv cs.LG@Aygün Varol, Katarzyna Kołodziej, Łukasz Sobczak, Michał Romaszewski, Przemysław Głomb, Naser Hossein Motlagh, Mirka Leino, Johanna Virkki

这篇论文提出结构化提示构建框架，将原始空气质量和热舒适传感器数据转化为三种渐进的文本表示（原始值、阈值描述、环境摘要）。研究使用室内Raspberry Pi/BME680数据集和户外华沙等城市数据集，评估5个本地和5个云端LLM。在无思维链推理模式下，本地模型准确率从50.9%提升至81.7%（室内），从63.7%提升至89.3%（户外），平均延迟仅0.22秒。结果表明轻量级预处理可显著缩小边缘与云端的准确率差异。

论文 LLM IoT数据预处理边缘AI 提示工程环境监测

推荐理由：把传感器数据预处理成文字提示，小模型准确率能从50%涨到89%，延迟才0.22秒，不比云端差。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:45

11:45

arXiv cs.AI@Aniq Ahmad, Heather Bedle, Ahmad Mustafa

本文提出一个零样本框架，将Segment Anything Model (SAM)用于地震解释，无需微调。框架包括两个组件：1) 根据地质目标对齐地震属性与可视化（如色图）；2) 混合提示策略，结合稀疏用户定义点提示与SAM内部特征激活生成的稠密掩码提示。在多个地质目标、数据集和提示配置下评估，发现地质目标感知的属性选择与混合提示可提升边界描绘和分割精度。结果表明，零样本SAM能达到有竞争力的分割性能，减少对标注数据的依赖。

论文 SAM 地震解释零样本提示工程分割

推荐理由：这篇论文教你如何在不微调的情况下用SAM做地震图分割，用混合提示和属性选择就能提升效果，挺实用的。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

17:47

17:47

AI Will@FinanceYF5

精选

Peter Steinberger 提出，未来不应再手动提示 AI 代理，而应设计让代理自动提示自己的循环系统。这种思路将提示从一次性操作转变为持续迭代的自动化流程，能显著提升效率和效果。对于使用 AI 编程或自动化工具的开发者，构建这样的循环系统可以解放双手，让代理自主优化任务。

AI产品 AI代理自动化循环系统提示工程编程助手

推荐理由：这条思路直击当前 AI 代理使用中的效率瓶颈，做自动化或编程的团队值得尝试构建循环提示系统，能省下大量手动调参时间。

00:55

00:55

elvis@omarsar0

dair_ai 创始人宣布推出基于 AI Agent 的实操学习平台，首批上线 4 个动手实验，涵盖 Agent 技能、Agentic 图像生成、30 天 Hermes Agent 挑战和 Agent 提示工程。该平台旨在让任何人通过构建和获取高需求 AI 技能，成为顶级 AI 构建者。未来几周还将有更多内容上线。

AI产品 AI Agent 实操课程 dair_ai 提示工程图像生成

推荐理由：想系统掌握 AI Agent 构建技能的开发者，现在有了直接上手的实操路径——4 个实验覆盖从基础到进阶，建议立即体验。

6月9日

01:17

01:17

elvis@omarsar0

开发者应转向设计循环（loops）来驱动AI代理，而非手动输入提示。新LLM训练后能更长时间不间断执行任务，循环可充分利用这一特性。该方法通过编码清晰目标的指令，实现自动化流程。这并非全新概念，但当前模型能力使其更可行。

AI产品 AI代理自动化循环设计提示工程 LLM

推荐理由：做AI代理和自动化开发的团队，可以试试用循环替代手动提示，让LLM更高效地执行长任务。

6月8日

11:20

11:20

arXiv cs.AI@Luca Avena, Gianmarco Bet, Bernardo Busoni

该研究通过构建标准与反直觉两类离散概率问题数据集，测试了8个前沿大语言模型的概率推理能力。模型在标准问题上平均准确率达0.96，但在反直觉问题上骤降至0.59。研究还发现token偏差：将规范表述替换为伪装变体后性能下降超20%；在提示中嵌入误导性建议可使性能下降高达34%，且没有模型能免疫。结果表明，尽管LLM在高级数学问题上表现出色，但它们并非真正的概率推理者。

论文大语言模型概率推理基准测试 token偏差提示工程

推荐理由：想用LLM做决策或数据分析的开发者注意了——模型在概率推理上存在系统性漏洞，反直觉问题和提示误导能轻易让它翻车，建议点开看看测试细节，避免在实际应用中踩坑。

6月7日

09:44

09:44

pandaily@contact@pandaily.com (Pandaily)

Harness Engineering 是近期 AI 领域兴起的新概念，旨在通过系统化方法将 AI 模型的能力“驾驭”到实际应用中。它强调在模型训练之外，设计有效的输入输出接口、反馈循环和任务分解策略，以提升 AI 系统的可靠性和实用性。这一范式被认为是对传统“提示工程”的升级，尤其适用于复杂任务和多步骤工作流。该概念由多位 AI 研究者和从业者推动，正在成为行业讨论的焦点。

AI模型 Harness Engineering AI 范式提示工程系统化方法 AI 应用

推荐理由：Harness Engineering 解决了 AI 落地中模型能力与真实场景脱节的问题，做 AI 应用开发或系统集成的团队值得关注，它可能改变你设计 AI 工作流的方式。

6月4日

07:43

07:43

Replicate@replicate

Replicate 宣布与 xAI 合作，将其模型引入平台，并发布了针对最新视频模型 Grok Imagine Video 1.5 的终极提示指南。该指南旨在帮助用户更好地利用该模型生成高质量视频内容。此次合作使开发者能够更便捷地访问 xAI 的视频生成能力。对于从事 AI 视频创作的用户来说，这是一份实用的资源。

AI产品视频生成 Grok Imagine Video 1.5 提示工程 Replicate xAI

推荐理由：做 AI 视频生成的开发者可以直接用这份指南提升 Grok Imagine Video 1.5 的出片质量，值得收藏。

5月27日

11:02

11:02

Greg Brockman@gdb

开发者 Theo 在 X 上分享了他对 GPT-5.5 的深度使用体验，称经过两个月的适应后，GPT-5.5 已成为他无法替代的编码模型。他指出，要发挥 GPT-5.5 的全部能力，需要完全不同的提示方式，并花时间配置 agents.md 文件。一旦跨过学习曲线，其他模型在代码任务上都无法与之相比。这反映了 GPT-5.5 在编程领域的独特优势，也提示开发者需要调整使用习惯。

AI模型 GPT-5.5 编码模型开发者体验提示工程 AI编程

推荐理由：做 AI 编程的开发者如果还在用旧模型，值得花时间适应 GPT-5.5 的独特提示方式——跨过门槛后，其他模型可能就回不去了。

5月25日

12:08

12:08

Greg Brockman@gdb

精选

VB Srivastav 分享了一个改进版的 Codex 自我改进提示，让 Codex 跨会话、记忆和 Chronicle 查找重复的手动工作流，并自动创建最小的实用技能、子代理或自动化。提示要求 Codex 优先复用已有资产，只对高频、稳定、可重复的任务进行打包，避免创建重复或过于宽泛的内容。最终输出包括创建了什么、跳过了什么以及需要更多证据的项目。这个提示能显著提升 Codex 用户的自动化效率，减少重复劳动。

AI产品 Codex 自动化提示工程工作流优化 AI 助手

推荐理由：频繁使用 Codex 的开发者可以靠这个提示自动发现并打包重复工作流，省去手动梳理的麻烦，直接提升自动化效率。

5月20日

15:38

15:38

arXiv cs.AI@Saurav Ghosh, Gabriella Polach, Abdou Sow

精选

这篇论文研究了结构化提示设计是否能提升大语言模型的回答质量并减少用户交互成本。研究者对比了三种提示条件：原始提示、清单改进提示和澄清问题提示，在摘要、规划、解释和编程四种任务上测试了ChatGPT、Claude和Grok三个模型。结果显示，清单改进提示的平均评分最高（7.50/8），远超原始提示（5.67）和澄清问题提示（6.67），且使用的token数更少。研究表明，简单的提示清单就能显著提升回答质量并减少不必要的来回交互。

论文提示工程结构化提示清单提示 LLM 研究论文

推荐理由：做AI提示工程或日常使用LLM的开发者，用清单提示法能直接提升输出质量并省去反复调试的麻烦，建议试试这个简单但有效的技巧。

14:53

14:53

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 指出，常见的提示错误是直接让 AI 生成最终稿。更好的工作流是先让 AI 生成大纲，通过调整结构来显著改善最终输出，避免 AI 写作的通用化问题。Andrew Ng 在《AI Prompting for Everyone》课程中教授了实用提示技巧。

技巧提示工程 AI写作工作流 Andrew Ng DeepLearning.AI

推荐理由：这个提示技巧能帮写作者避免 AI 内容的千篇一律，做内容创作或文档撰写的团队值得一试。

5月19日

11:28

11:28

arXiv cs.AI@Pawat Chunhachatrachai, Gueter Josmy Faure, Hung-Ting Su, Winston H. Hsu

精选

SpatioRoute 是一种无需训练或微调的动态提示生成方法，用于提升视觉语言模型在零样本设置下对第一人称视频的空间问答能力。它通过规则或大语言模型驱动的路由，将每个问题映射到语义定制的提示模板，在 SQA3D 基准上相比固定提示基线提升高达 5% 的准确率，且无需 3D 点云输入。研究还发现，链式思维提示在 Qwen 系列模型上反而会降低性能，表明问题感知路由比统一推理指令更有效。

论文零样本推理空间问答提示工程视觉语言模型 SQA3D

推荐理由：做零样本视频空间推理的团队终于有了一个即插即用的提升方案——SpatioRoute 无需额外训练就能涨点 5%，做 VLM 应用的开发者可以直接在 SQA3D 上试试。

5月16日

23:36

23:36

Martin Fowler@martinfowler

Martin Fowler 分享了一个高效为LLM提供上下文的方法：与其自己手动写，不如让LLM像采访一样提问，你回答即可。这种方法能节省时间，同时确保上下文完整且结构化。Fowler 认为这比直接写更自然，尤其适合需要大量背景信息的场景。该技巧对需要频繁与LLM协作的开发者或写作者很有启发。

技巧 LLM上下文效率技巧 Martin Fowler 提示工程 AI协作

推荐理由：Fowler 的这个技巧解决了手动写上下文的痛点，经常用LLM做复杂任务的开发者可以直接试试，省时又高效。

16:50

16:50

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 发布了一门面向所有人的 AI 提示工程课程《AI Prompting for Everyone》，旨在帮助用户掌握提示词设计、上下文窗口等 AI 系统基础原理。课程适合零基础学习者，无需编程经验即可上手。通过这门课，用户可以更高效地与 AI 交互，提升日常工作和学习中的 AI 使用效果。该课程是 DeepLearning.AI 系列课程的一部分，延续了其高质量教育内容的口碑。

AI产品提示工程 AI 教育 DeepLearning.AI 入门课程上下文窗口

推荐理由：想系统学习提示词工程但怕门槛太高？这门课从零讲起，适合所有想用好 AI 的非技术用户，学完就能直接提升与 ChatGPT 等工具的对话质量。

5月14日

13:27

13:27

arXiv: OpenAI@Andreas Maier, Jeta Sopa, Gozde Gul Sahin, Paula Perez-Toro, Siming Bayer

精选75°

一项研究复现了 Wu 等人（2026）的发现：多数前沿大语言模型在系统提示中包含软赞助线索时，会推荐价格约两倍的赞助航班。研究者对 10 个开源聊天模型和 2 个 OpenAI 模型（gpt-3.5-turbo、gpt-4o）进行了评估，发现原文的结论具有普遍性——例如 gpt-3.5-turbo 的赞助推荐率与原报告接近。关键发现是：一个仅 30 个 token 的用户提示（要求模型先提供中立对比表格）可将开源模型的赞助推荐率从 46.9% 降至 1.0%，OpenAI 模型从 53.0% 降至 0%。研究还揭示了复现过程中的三个隐性实现错误，表明仅靠文字描述不足以准确复现。

论文 LLM 赞助推荐提示工程复现研究 AI 安全

推荐理由：这篇论文揭示了 LLM 推荐中的赞助偏见，并提供了一个极简的对抗方法——用 30 token 提示词就能大幅降低推荐偏差。做 AI 安全、推荐系统或 LLM 应用的开发者值得一看，可以直接复现实验。

07:26

07:26

Ethan Mollick@emollick

Ethan Mollick 在 X 上发文，呼吁用户停止将 AI 提示词神秘化，包括使用含义不明的斜杠命令。他认为与 AI 交互应该像与经理沟通一样，用清晰、结构化的格式直接提出需求，而不是像巫师念咒语。这一观点直击当前提示工程中过度复杂化的痛点，强调简单直接才是高效使用 AI 的关键。

技巧提示工程 AI交互效率 Ethan Mollick

推荐理由：Mollick 戳破了提示工程中的玄学泡沫，做 AI 应用或日常使用大模型的团队，看完会重新审视自己的提示词写法，建议直接照做。

5月12日

18:01

18:01

Ethan Mollick@emollick

研究人员发现，通过精心调整提示词，可以使AI生成的文本在读者眼中不再像AI写作。这挑战了人们依赖字数与思考量、价值感挂钩的直觉认知。随着这类技术普及，检测AI生成内容的难度将显著增加，可能对内容创作、学术诚信等领域产生深远影响。

AI产品 AI写作提示工程内容检测学术诚信 AI安全

推荐理由：揭示了AI写作隐匿性的新问题，对内容真实性验证、学术规范及行业实践提出挑战，值得关注。