23:42宝玉@dotey一位网友在 X 上分享了对主流 AI 模型 Deep Research 功能的对比体验,认为 ChatGPT 的 DeepResearch 表现最好,Gemini 凭借搜索能力紧随其后,而 Claude 在这方面表现不佳。同时指出,在编程、工程任务及需要联网搜索计算分析结论的场景中,Claude 5.5 远强于 Opus,后者搜索能力几乎不可用。该对比为开发者选择不同模型进行深度研究提供了参考。AI产品Deep ResearchChatGPTGeminiClaude搜索能力推荐理由:做深度调研或需要联网分析结论的团队,可以按 ChatGPT > Gemini > Claude 的顺序选模型,编程任务则优先用 Claude 5.5,实测对比能帮你省下试错时间。原文
11:24berryxia@berryxia精选ExaAILabs完成了一项关键实验,在强化学习阶段训练LLM的搜索能力。一组使用Google数据,另一组使用Exa搜索API。结果显示,使用Exa API的模型性能更高,同时训练算力节省了70%。这一发现挑战了“堆算力才能提升AI搜索”的传统认知,表明搜索工具的质量和效率比算力数量更关键。对AI Agent、RAG和带搜索能力的大模型团队有重要启示。AI模型强化学习搜索能力Exa API算力效率AI Agent推荐理由:这个实验直接挑战了“堆算力才能提升AI搜索”的行业共识,做AI Agent、RAG或训练搜索模型的团队,看完会重新思考工具选型——建议点开原文看完整blog。原文