09:51arXiv cs.AI@Lei Lin, Ronghao Wang, Chunbao Zhou, Jue Wang, Yangang Wang精选DN-Hypo-Pipeline 是一个基于大语言模型的AI工作流,旨在通过利用科学解释作为先验知识,辅助研究人员从现有文献中推导出新颖的研究假设。该管道从论文的结论(explanandum)出发,识别其背后的定律、理论和原理,并重构出对观察现象的新解释。在数据科学建模领域的评估中,结合LLM裁判和人类专家评价,该管道比直接生成方法更有效。此外,两个得分最高的生成假设被转化为新算法,性能超过了原论文的基线模型。该方法本质上是理论引导建模的泛化,有望扩展到其他科学领域。论文假设生成大语言模型科学解释理论引导建模数据科学推荐理由:做科研假设生成或理论驱动建模的研究者,可以用这个管道从文献中自动挖掘新假设,比手动推导更系统高效,值得在数据科学之外的其他学科试试。原文
16:15IT之家(博客/媒体)JetBrains 宣布弃用独立版 DataSpell,停止向新客户销售许可证,现有用户可继续使用至许可证到期。从9月1日起,个人和商业DataSpell许可证将自动转换为PyCharm Pro订阅,并用AI Credits匹配剩余价值。DataSpell面向数据科学家,支持Jupyter Notebook、数据探索和分析工作流,但JetBrains认为其功能已整合进PyCharm,维护独立应用不再高效。PyCharm Pro将覆盖更广泛用户,包括本地与远程Jupyter服务器、SQL集成和Web开发框架。学生和开源贡献者需手动申请PyCharm教育豁免。AI产品JetBrainsDataSpellPyCharm Pro数据科学IDE推荐理由:数据科学家和数据分析师不用再纠结选哪个工具——PyCharm Pro 整合了 DataSpell 的核心能力,还多了 Web 开发支持,现有用户自动迁移省心省力,建议检查许可证状态。原文
23:45Philipp Schmid@_philschmid精选Google 在 Gemini API 中推出了 Managed Agents 功能,允许开发者通过一次 API 调用即可获得一个沙盒化的 Linux 环境,支持代码执行、网络访问和文件 I/O。开发者可以挂载自定义技能,创建可复用的智能体,并直接调用。官方提供了一个构建数据科学助手的完整示例。这一功能大幅简化了 AI 智能体的部署和运行流程,适合需要快速构建可执行代码的 AI 应用的团队。AI产品智能体Gemini API沙盒环境代码执行数据科学推荐理由:做 AI 智能体或自动化工具的开发者终于可以一键获得沙盒环境,省去自己搭建基础设施的麻烦,建议直接试试这个数据科学助手示例。原文
21:12Lenny Rachitsky@lennysan一位数据科学家朋友透露,团队大部分工作变成了审查产品经理和工程师用 AI 做的半吊子数据分析,其中 50% 是错误的。这导致数据科学家的角色变得不那么有趣,更多是纠错而非创造。AI 工具让非专业人士也能进行数据分析,但质量参差不齐,反而增加了专业数据科学家的负担。这一现象反映了 AI 普及对专业岗位的冲击,值得关注。行业AI 影响数据科学角色转变AI 分析行业观察推荐理由:数据科学家和 AI 从业者会感同身受——AI 让更多人能做分析,但错误率高达 50%,专业角色反而变成“AI 质检员”。点开看看,你会重新思考 AI 工具对团队协作的影响。原文